今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
TeleSculptor:空撮動画からPhotogramme...
GoogleのDeep Learning論文
Kinect for Windows V2のプレオーダー開始
海外ドラマのChromaKey
OpenAR:OpenCVベースのマーカーARライブラリ
PGGAN:段階的に解像度を上げて学習を進めるGAN
Cartographer:オープンソースのSLAMライブラリ
携帯電話ロボット『RoBoHoN(ロボホン)』
ベイズ推定とグラフィカルモデル
Theia:オープンソースのStructure from M...
OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...
Open3D:3Dデータ処理ライブラリ
オープンソースのロボットアプリケーションフレームワーク『RO...
Mask R-CNN:ディープラーニングによる一般物体検出・...
OpenGVの用語
Dlib:C++の機械学習ライブラリ
OpenCVで動画の手ぶれ補正
続・ディープラーニングの資料
Fast R-CNN:ディープラーニングによる一般物体検出手...
OpenCV 3.1のsfmモジュールのビルド再び
UnrealCV:コンピュータビジョン研究のためのUnrea...
viser:Pythonで使える3D可視化ライブラリ
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
オープンソースの顔認識フレームワーク『OpenBR』
Googleが画像解析旅行ガイドアプリのJetpac社を買収
iPhoneで3D写真が撮れるアプリ『seene』
Super Resolution:OpenCVの超解像処理モ...
PSPNet (Pyramid Scene Parsing ...
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
書籍『ROSプログラミング』
UnityでPoint Cloudを表示する方法
Faster R-CNN:ディープラーニングによる一般物体検...
OpenCV
Kubric:機械学習用アノテーション付き動画生成パイプライ...
TensorSpace.js:ニューラルネットワークの構造を...
畳み込みニューラルネットワーク (CNN: Convolut...
OpenCVで平均顔を作るチュートリアル
MVStudio:オープンソースのPhotogrammetr...
ニューラルネットワークで画像分類
OpenCVで顔のランドマークを検出する『Facemark ...
NeRF (Neural Radiance Fields):...
OpenCV3.3.0でsfmモジュールのビルドに成功!

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]