今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
ディープラーニング
ニューラルネットワークと深層学習
3D復元技術の情報リンク集
Caffe:読みやすくて高速なディープラーニングのフレームワ...
OpenGVのライブラリ構成
オープンソースの顔の動作解析ツールキット『OpenFace』
Live CV:インタラクティブにComputer Visi...
DCGAN (Deep Convolutional GAN)...
AR (Augmented Reality)とDR (Dim...
DUSt3R:3Dコンピュータービジョンの基盤モデル
OpenCVで顔のランドマークを検出する『Facemark ...
OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...
Googleが画像解析旅行ガイドアプリのJetpac社を買収
Pix2Pix:CGANによる画像変換
OpenCVでiPhone6sのカメラをキャリブレーションす...
書籍『ゼロから作るDeep Learning』で自分なりに学...
iPhoneで3D写真が撮れるアプリ『seene』
2D→3D復元技術で使われる用語まとめ
ロボットクリエーター
光学式マウスのセンサーを応用すると…
TeleSculptor:空撮動画からPhotogramme...
OpenCVの超解像(SuperResolution)モジュ...
NeRF (Neural Radiance Fields):...
OpenCV
携帯電話ロボット『RoBoHoN(ロボホン)』
Multi-View Environment:複数画像から3...
UnrealCV:コンピュータビジョン研究のためのUnrea...
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...
Accord.NET Framework:C#で使える機械学...
Blendify:コンピュータービジョン向けBlenderラ...
SegNet:ディープラーニングによるSemantic Se...
Leap MotionでMaya上のオブジェクトを操作できる...
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
オープンソースの顔認識フレームワーク『OpenBR』
海外ドラマのChromaKey
MVStudio:オープンソースのPhotogrammetr...
Google製オープンソース機械学習ライブラリ『Tensor...
Rerun:マルチモーダルデータの可視化アプリとSDK
機械学習について最近知った情報
畳み込みニューラルネットワーク (CNN: Convolut...
U-Net:ディープラーニングによるSemantic Seg...
Dlib:C++の機械学習ライブラリ

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]