画像認識による位置情報取得 – Semi-Direct Monocular Visual Odometry (SVO)

今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。



論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305



論文を読んだ人のツイート。↓



世の中スゲェ人だらけだなぁ。

関連記事

Dlib:C++の機械学習ライブラリ

OpenCVの顔検出過程を可視化した動画

OpenCVで顔のモーフィングを実装する

TeleSculptor:空撮動画からPhotogramme...

ニューラルネットワークで画像分類

FCN (Fully Convolutional Netwo...

書籍『ゼロから作るDeep Learning』で自分なりに学...

Kornia:微分可能なコンピュータービジョンライブラリ

PyTorch3D:3Dコンピュータービジョンライブラリ

Structure from Motion (多視点画像から...

TensorFlowでCGを微分できる『TensorFlow...

オープンソースの顔認識フレームワーク『OpenBR』

OpenCV 3.1とopencv_contribモジュール...

Google Colaboratoryで遊ぶ準備

Pix2Pix:CGANによる画像変換

ArUco:OpenCVベースのコンパクトなARライブラリ

OpenCVでカメラ画像から自己位置認識 (Visual O...

Facebookの顔認証技術『DeepFace』

Kinect for Windows V2のプレオーダー開始

写真から3Dメッシュの生成・編集ができる無料ツール『Auto...

Point Cloud Libraryに動画フォーマットが追...

iPhoneで3D写真が撮れるアプリ『seene』

オープンソースの顔の動作解析ツールキット『OpenFace』

ディープラーニング

openMVG:複数視点画像から3次元形状を復元するライブラ...

Live CV:インタラクティブにComputer Visi...

VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...

RefineNet (Multi-Path Refineme...

Point Cloud Consortiumのセミナー「3D...

Cartographer:オープンソースのSLAMライブラリ

SSD (Single Shot Multibox Dete...

畳み込みニューラルネットワーク (CNN: Convolut...

顔追跡による擬似3D表示『Dynamic Perspecti...

hloc:SuperGlueで精度を向上させたSfM・Vis...

Mask R-CNN:ディープラーニングによる一般物体検出・...

BGSLibrary:OpenCVベースの背景差分ライブラリ

Adobe MAX 2015

第25回コンピュータビジョン勉強会@関東に行って来た

SegNet:ディープラーニングによるSemantic Se...

Faceshiftで表情をキャプチャしてBlender上でM...

Google製オープンソース機械学習ライブラリ『Tensor...

画像生成AI Stable Diffusionで遊ぶ

コメント

  1. […] 画像認識による位置情報取得 ? Semi-Direct Monocular Visual Odometry (SVO) […]