今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
Caffe:読みやすくて高速なディープラーニングのフレームワ...
DUSt3R:3Dコンピュータービジョンの基盤モデル
機械学習手法『Random Forest』
Faceshiftで表情をキャプチャしてBlender上でM...
顔画像処理技術の過去の研究
VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...
TensorSpace.js:ニューラルネットワークの構造を...
コンピュータビジョンの技術マップ
オープンソースの顔認識フレームワーク『OpenBR』
OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...
Kinect for Windows v2の日本価格決定
OpenCVでカメラ画像から自己位置認識 (Visual O...
Google Colaboratoryで遊ぶ準備
顔追跡による擬似3D表示『Dynamic Perspecti...
PeopleSansPeople:機械学習用の人物データをU...
Open3D:3Dデータ処理ライブラリ
Point Cloud Consortiumのセミナー「3D...
NeRF (Neural Radiance Fields):...
FCN (Fully Convolutional Netwo...
Structure from Motion (多視点画像から...
CNN Explainer:畳み込みニューラルネットワーク可...
Google製オープンソース機械学習ライブラリ『Tensor...
画像生成AI Stable Diffusionで遊ぶ
TeleSculptor:空撮動画からPhotogramme...
AR (Augmented Reality)とDR (Dim...
Facebookの顔認証技術『DeepFace』
PyTorch3D:3Dコンピュータービジョンライブラリ
BGSLibrary:OpenCVベースの背景差分ライブラリ
PGGAN:段階的に解像度を上げて学習を進めるGAN
U-Net:ディープラーニングによるSemantic Seg...
Regard3D:オープンソースのStructure fro...
統計的な顔モデル
Point Cloud Libraryに動画フォーマットが追...
光学式マウスのセンサーを応用すると…
TorchStudio:PyTorchのための統合開発環境と...
UnityでOpenCVを使うには?
UnityでPoint Cloudを表示する方法
OpenCV 3.1とopencv_contribモジュール...
OpenCVの三角測量関数『cv::triangulatep...
PCA (主成分分析)
ROSでガンダムを動かす
OpenCVの超解像(SuperResolution)モジュ...

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]