今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
Dlib:C++の機械学習ライブラリ
3D Gaussian Splatting:リアルタイム描画...
OpenCV3.3.0でsfmモジュールのビルドに成功!
Adobeの手振れ補正機能『ワープスタビライザー』の秘密
TensorSpace.js:ニューラルネットワークの構造を...
書籍『ROSプログラミング』
OpenCVで平均顔を作るチュートリアル
Digital Emily Project:人間の顔をそっく...
DCGAN (Deep Convolutional GAN)...
顔追跡による擬似3D表示『Dynamic Perspecti...
TeleSculptor:空撮動画からPhotogramme...
オープンソースの顔認識フレームワーク『OpenBR』
OpenSfM:PythonのStructure from ...
Open3D:3Dデータ処理ライブラリ
畳み込みニューラルネットワーク (CNN: Convolut...
Kornia:微分可能なコンピュータービジョンライブラリ
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
iPadをハンディ3Dスキャナにするガジェット『iSense...
Faceshiftで表情をキャプチャしてBlender上でM...
Point Cloud Libraryに動画フォーマットが追...
SSII 2014 デモンストレーションセッションのダイジェ...
OpenCVの三角測量関数『cv::triangulatep...
Structure from Motion (多視点画像から...
U-Net:ディープラーニングによるSemantic Seg...
顔画像処理技術の過去の研究
NeRF (Neural Radiance Fields):...
Accord.NET Framework:C#で使える機械学...
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...
OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...
RefineNet (Multi-Path Refineme...
TorchStudio:PyTorchのための統合開発環境と...
UnrealCV:コンピュータビジョン研究のためのUnrea...
海外ドラマのChromaKey
Facebookの顔認証技術『DeepFace』
openMVGをWindows10 Visual Studi...
Blendify:コンピュータービジョン向けBlenderラ...
Multi-View Environment:複数画像から3...
オープンソースのロボットアプリケーションフレームワーク『RO...
今年もSSII
OpenGVのライブラリ構成
iPhoneで3D写真が撮れるアプリ『seene』
SONYの自律型エンタテインメントロボット『aibo』
コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]