今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
OpenCVのバージョン3が正式リリースされたぞ
第25回コンピュータビジョン勉強会@関東に行って来た
Rerun:マルチモーダルデータの可視化アプリとSDK
統計的な顔モデル
OpenCV 3.1のsfmモジュールのビルド再び
U-Net:ディープラーニングによるSemantic Seg...
ROSの薄い本
iPadをハンディ3Dスキャナにするガジェット『iSense...
Google Colaboratoryで遊ぶ準備
Point Cloud Libraryに動画フォーマットが追...
PSPNet (Pyramid Scene Parsing ...
3D Gaussian Splatting:リアルタイム描画...
Cartographer:オープンソースのSLAMライブラリ
ロボットクリエーター
SSII 2014 デモンストレーションセッションのダイジェ...
CGAN (Conditional GAN):条件付き敵対的...
TorchStudio:PyTorchのための統合開発環境と...
OpenGVのライブラリ構成
OpenCV 3.1から追加されたSfMモジュール
OpenSfM:PythonのStructure from ...
PCA (主成分分析)
Digital Emily Project:人間の顔をそっく...
Pix2Pix:CGANによる画像変換
OpenGVの用語
海外ドラマのChromaKey
VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...
Faceshiftで表情をキャプチャしてBlender上でM...
OpenCVで顔のランドマークを検出する『Facemark ...
SSII2014 チュートリアル講演会の資料
AR (Augmented Reality)とDR (Dim...
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
Blendify:コンピュータービジョン向けBlenderラ...
Kubric:機械学習用アノテーション付き動画生成パイプライ...
Kornia:微分可能なコンピュータービジョンライブラリ
viser:Pythonで使える3D可視化ライブラリ
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...
ポイントクラウドコンソーシアム
OpenFace:Deep Neural Networkによ...
OpenCVのfindEssentialMat関数を使ったサ...
Adobeの手振れ補正機能『ワープスタビライザー』の秘密
ニューラルネットワークと深層学習
RefineNet (Multi-Path Refineme...

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]