画像認識による位置情報取得 – Semi-Direct Monocular Visual Odometry (SVO)

今日たまたまTwitterのTLで見かけたやつ。
単眼のカメラ映像からリアルタイムに位置情報を取得している。

論文はこちら
そして、GitHubにROSで動作するソースコードが公開されている。
http://paropon.hatenablog.com/entry/2015/01/17/221305

論文を読んだ人のツイート。↓

さっきTLに流れてきたSVO論文読了。前フレームとの視差で初期位置推定、キーフレームとの視差で更に高精度位置推定、最後に局所的にBAするスレッドと、3D点をベイズ推定する的なスレッドから構成される感じかな。てか、割と良くやるアプローチのような気もする。

— kf (@peisuke) 2014, 6月 18

SVOが使っているのはSophus（Eigenベースの回転群実装）ですが，PTAMはTooNを使っています．回転群以外にも色々あります． http://t.co/871zhcqyl4

— Toru Tamaki (@ttttamaki) 2014, 6月 20

世の中スゲェ人だらけだなぁ。

Blendify：コンピュータービジョン向けBlenderラッパー

iPhoneで3D写真が撮れるアプリ『seene』

fSpy：1枚の写真からカメラパラメーターを割り出すツール

Paul Debevec

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

TorchStudio：PyTorchのための統合開発環境とエコシステム

GoogleのDeep Learning論文

OpenCVのバージョン3が正式リリースされたぞ

COLMAP：オープンソースのSfM・MVSツール

OpenCVで動画の手ぶれ補正

SDカードサイズのコンピューター『Intel Edison』

Autodesk Mementoでゴジラを3次元復元する

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

OpenCVでiPhone6sのカメラをキャリブレーションする

TensorFlowでCGを微分できる『TensorFlow Graphics』

Kornia：微分可能なコンピュータービジョンライブラリ

機械学習について最近知った情報

BlenderでPhotogrammetryできるアドオン

PGGAN：段階的に解像度を上げて学習を進めるGAN

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

Fast R-CNN：ディープラーニングによる一般物体検出手法

書籍『OpenCV 3 プログラミングブック』を購入

Caffe：読みやすくて高速なディープラーニングのフレームワーク

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

PyTorch3D：3Dコンピュータービジョンライブラリ

顔画像処理技術の過去の研究

画像生成AI Stable Diffusionで遊ぶ

Accord.NET Framework：C#で使える機械学習ライブラリ

2D→3D復元技術で使われる用語まとめ

Active Appearance Models（AAM）

OpenCV 3.1から追加されたSfMモジュール

Dlib：C++の機械学習ライブラリ

Structure from Motion (多視点画像からの3次元形状復元)

3D復元技術の情報リンク集

OpenCVで顔のランドマークを検出する『Facemark API』

Kinect for Windows V2のプレオーダー開始

機械学習手法『Random Forest』

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

オープンソースの顔の動作解析ツールキット『OpenFace』

Live CV：インタラクティブにComputer Visionコーディングができるツール

関連記事

Blendify：コンピュータービジョン向けBlenderラッパー

iPhoneで3D写真が撮れるアプリ『seene』

fSpy：1枚の写真からカメラパラメーターを割り出すツール

Paul Debevec

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

TorchStudio：PyTorchのための統合開発環境とエコシステム

GoogleのDeep Learning論文

OpenCVのバージョン3が正式リリースされたぞ

COLMAP：オープンソースのSfM・MVSツール

OpenCVで動画の手ぶれ補正

SDカードサイズのコンピューター『Intel Edison』

Autodesk Mementoでゴジラを3次元復元する

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

OpenCVでiPhone6sのカメラをキャリブレーションする

TensorFlowでCGを微分できる『TensorFlow Graphics』

Kornia：微分可能なコンピュータービジョンライブラリ

機械学習について最近知った情報

BlenderでPhotogrammetryできるアドオン

PGGAN：段階的に解像度を上げて学習を進めるGAN

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

Fast R-CNN：ディープラーニングによる一般物体検出手法

書籍『OpenCV 3 プログラミングブック』を購入

Caffe：読みやすくて高速なディープラーニングのフレームワーク

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

PyTorch3D：3Dコンピュータービジョンライブラリ

顔画像処理技術の過去の研究

画像生成AI Stable Diffusionで遊ぶ

Accord.NET Framework：C#で使える機械学習ライブラリ

2D→3D復元技術で使われる用語まとめ

Active Appearance Models（AAM）

OpenCV 3.1から追加されたSfMモジュール

Dlib：C++の機械学習ライブラリ

Structure from Motion (多視点画像からの3次元形状復元)

3D復元技術の情報リンク集

OpenCVで顔のランドマークを検出する『Facemark API』

Kinect for Windows V2のプレオーダー開始

機械学習手法『Random Forest』

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

オープンソースの顔の動作解析ツールキット『OpenFace』

Live CV：インタラクティブにComputer Visionコーディングができるツール

コメント

個人情報に関するお知らせ