今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。
論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305
論文を読んだ人のツイート。↓
さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。
— kf (@peisuke) 2014, 6月 18
SVOが使っているのはSophus(Eigenベースの回転群実装)ですが,PTAMはTooNを使っています.回転群以外にも色々あります. http://t.co/871zhcqyl4
— Toru Tamaki (@ttttamaki) 2014, 6月 20
世の中スゲェ人だらけだなぁ。
関連記事
Digital Emily Project:人間の顔をそっく...
CGのためのディープラーニング
PeopleSansPeople:機械学習用の人物データをU...
ArUco:OpenCVベースのコンパクトなARライブラリ
Google Colaboratoryで遊ぶ準備
CycleGAN:ドメイン関係を学習した画像変換
UnityでOpenCVを使うには?
DUSt3R:3Dコンピュータービジョンの基盤モデル
ベイズ推定とグラフィカルモデル
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
SSII2014 チュートリアル講演会の資料
GAN (Generative Adversarial Ne...
CGAN (Conditional GAN):条件付き敵対的...
Adobeの手振れ補正機能『ワープスタビライザー』の秘密
CNN Explainer:畳み込みニューラルネットワーク可...
コンピュータビジョンの技術マップ
YOLO (You Only Look Once):ディープ...
Accord.NET Framework:C#で使える機械学...
海外ドラマのChromaKey
Runway ML:クリエイターのための機械学習ツール
ポイントクラウドコンソーシアム
OpenCVでカメラ画像から自己位置認識 (Visual O...
Dlib:C++の機械学習ライブラリ
U-Net:ディープラーニングによるSemantic Seg...
RefineNet (Multi-Path Refineme...
OpenCV 3.1とopencv_contribモジュール...
OpenCV バージョン4がリリースされた!
FacebookがDeep learningツールの一部をオ...
AR (Augmented Reality)とDR (Dim...
Iridescence:プロトタイピング向け軽量3D可視化ラ...
Faceshiftで表情をキャプチャしてBlender上でM...
Cartographer:オープンソースのSLAMライブラリ
OpenGVの用語
TensorSpace.js:ニューラルネットワークの構造を...
Faster R-CNN:ディープラーニングによる一般物体検...
Rerun:マルチモーダルデータの可視化アプリとSDK
Kubric:機械学習用アノテーション付き動画生成パイプライ...
Autodesk Mementoでゴジラを3次元復元する
3D復元技術の情報リンク集
R-CNN (Regions with CNN featur...
OpenSfM:PythonのStructure from ...
TeleSculptor:空撮動画からPhotogramme...

コメント
[…] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]