今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
Dlib:C++の機械学習ライブラリ
OpenCVの顔検出過程を可視化した動画
OpenCVで顔のモーフィングを実装する
TeleSculptor:空撮動画からPhotogramme...
ニューラルネットワークで画像分類
FCN (Fully Convolutional Netwo...
書籍『ゼロから作るDeep Learning』で自分なりに学...
Kornia:微分可能なコンピュータービジョンライブラリ
PyTorch3D:3Dコンピュータービジョンライブラリ
Structure from Motion (多視点画像から...
TensorFlowでCGを微分できる『TensorFlow...
オープンソースの顔認識フレームワーク『OpenBR』
OpenCV 3.1とopencv_contribモジュール...
Google Colaboratoryで遊ぶ準備
Pix2Pix:CGANによる画像変換
ArUco:OpenCVベースのコンパクトなARライブラリ
OpenCVでカメラ画像から自己位置認識 (Visual O...
Facebookの顔認証技術『DeepFace』
Kinect for Windows V2のプレオーダー開始
写真から3Dメッシュの生成・編集ができる無料ツール『Auto...
Point Cloud Libraryに動画フォーマットが追...
iPhoneで3D写真が撮れるアプリ『seene』
オープンソースの顔の動作解析ツールキット『OpenFace』
ディープラーニング
openMVG:複数視点画像から3次元形状を復元するライブラ...
Live CV:インタラクティブにComputer Visi...
VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...
RefineNet (Multi-Path Refineme...
Point Cloud Consortiumのセミナー「3D...
Cartographer:オープンソースのSLAMライブラリ
SSD (Single Shot Multibox Dete...
畳み込みニューラルネットワーク (CNN: Convolut...
顔追跡による擬似3D表示『Dynamic Perspecti...
hloc:SuperGlueで精度を向上させたSfM・Vis...
Mask R-CNN:ディープラーニングによる一般物体検出・...
BGSLibrary:OpenCVベースの背景差分ライブラリ
Adobe MAX 2015
第25回コンピュータビジョン勉強会@関東に行って来た
SegNet:ディープラーニングによるSemantic Se...
Faceshiftで表情をキャプチャしてBlender上でM...
Google製オープンソース機械学習ライブラリ『Tensor...
画像生成AI Stable Diffusionで遊ぶ

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]