今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
TensorSpace.js:ニューラルネットワークの構造を...
CycleGAN:ドメイン関係を学習した画像変換
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作っ...
ニューラルネットワークで画像分類
SSII2014 チュートリアル講演会の資料
OpenCVの三角測量関数『cv::triangulatep...
openMVG:複数視点画像から3次元形状を復元するライブラ...
続・ディープラーニングの資料
R-CNN (Regions with CNN featur...
コンピュータビジョンの技術マップ
TensorFlowでCGを微分できる『TensorFlow...
U-Net:ディープラーニングによるSemantic Seg...
Accord.NET Framework:C#で使える機械学...
ArUco:OpenCVベースのコンパクトなARライブラリ
DUSt3R:3Dコンピュータービジョンの基盤モデル
FCN (Fully Convolutional Netwo...
Digital Emily Project:人間の顔をそっく...
第25回コンピュータビジョン勉強会@関東に行って来た
VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...
OpenCV バージョン4がリリースされた!
SSII 2014 デモンストレーションセッションのダイジェ...
viser:Pythonで使える3D可視化ライブラリ
Googleが画像解析旅行ガイドアプリのJetpac社を買収
iPadをハンディ3Dスキャナにするガジェット『iSense...
光学式マウスのセンサーを応用すると…
Kubric:機械学習用アノテーション付き動画生成パイプライ...
Multi-View Environment:複数画像から3...
OpenCVで顔のモーフィングを実装する
OpenCVでカメラ画像から自己位置認識 (Visual O...
写真に3Dオブジェクトを違和感無く合成する『3DPhotoM...
PyTorch3D:3Dコンピュータービジョンライブラリ
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...
オープンソースのロボットアプリケーションフレームワーク『RO...
OpenCVでPhotoshopのプラグイン開発
UnrealCV:コンピュータビジョン研究のためのUnrea...
スクラッチで既存のキャラクターを立体化したい
2D→3D復元技術で使われる用語まとめ
3D Gaussian Splatting:リアルタイム描画...
Autodesk Mementoでゴジラを3次元復元する
PSPNet (Pyramid Scene Parsing ...
GAN (Generative Adversarial Ne...
書籍『ROSプログラミング』

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]