OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

本来なら例の書籍を読み進めて少しずつ理解していくつもりだったけど、しんどい。。。

期待していた書籍「3次元コンピュータビジョン計算ハンドブック」がついに発売されたので購入。3次元シーンを撮影した画像を解析して3次元情報を抽出するコンピュータビジョンの基礎技術を記述している．理論は最小限に抑えて，実際にプログラミングするた...

書籍はなかなか読み進められなかったので、飛ばし読みしてプログラムを動かしながら徐々にディティールを理解していく方針へ切り替えた(笑)

何度か格闘するも上手くいかないOpenCVのsfmモジュールのビルドもいったん諦めて、もっとプリミティブな関数をいじってお勉強しようと思う。
以前見つけたこちらのチュートリアルのサンプルコードでfindEssentialMat関数、つまりNist´erの5点アルゴリズムをいじってみる。

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

書籍「ROSではじめるロボットプログラミング」を一通り読み終わって、何となくロボットの自己位置認識の重要性を感じている。ロボット自身の移動量を計測する手法全般を"Odometry"と言うらしい。中でも1番簡単なやり方は、車輪などの駆動装置...

このサンプルコードはヘッダーファイルを含めても300行未満なので読みやすいはず。
https://github.com/avisingh599/mono-vo

このリポジトリのmono-vo/src/visodo.cppを読んでみる。

というか、まずはこのブログ記事を読むところからかな。
http://avisingh599.github.io/vision/monocular-vo/

ブログ記事の一部を雑に日本語訳。

課題設定 (Formulation of the problem)

Input

カメラから取得したグレイスケールのストリーム画像を入力とし、時刻 $t$ , 時刻 $t+1$ の時点で取得した画像をそれぞれ $I^t$ , $I^{t+1}$ と呼びます。カメラの固有パラメータは事前にキャリブレーションによって取得済みです。キャリブレーションはOpenCVでも行うことができます。

Output

全ての画像ペアで、2枚の画像間の車両の移動を表す回転行列 $R$ と並進ベクトル $t$ を求める必要があります。我々の単眼手法では並進ベクトル $t$ のスケール要素までは計算できません。

アルゴリズムの概要 (Algorithm Outline)

画像ペア： $I^t$ , $I^{t+1}$ の取得

上記画像の歪みを補正する。

$I^t$ からFASTアルゴリズムで特徴点を抽出し、それらの特徴点の $I^{t+1}$ までの移動を追跡する。特徴点の数が特定の閾値を下回った場合、新しい特徴点を検出する。

Nisterの5点アルゴリズム(with RANSAC)によってEssential Matrix(基本行列)を算出する。

上記ステップで求めたEssential Matrix(基本行列)から $R$ と $t$ を推定する。

スピードメーター等の外部ソースからスケール情報を取得し、並進ベクトル $t$ と回転行列 $R$ とを連結する。

ということで、詳しく知りたいのは特に4と5の基本行列を求めてそれを回転行列 $R$ と並進ベクトル $t$ へ分解するプロセスです。
サンプルコードで言うとほんの一部。116～119行目の辺りですね↓

  //recovering the pose and the essential matrix
  Mat E, R, t, mask;
  E = findEssentialMat(points2, points1, focal, pp, RANSAC, 0.999, 1.0, mask);
  recoverPose(E, points2, points1, R, t, focal, pp, mask);

findEssentialMatで求めた基本行列を回転行列と並進ベクトルへ分解する関数は上記のrecoverPoseだけじゃなく、decomposeEssentialMatというのも用意されてるんだが、decomposeEssentialMatでは特異値分解で2種類の $R$ と1つの $t$ ( $\pm$ 組み合わせで4つの解)が算出される。
唯一の解を求めたい場合はrecoverPoseに対応点の情報を渡して使う。

ちなみに、findEssentialMat関数の中身のコードはこちら→modules/calib3d/src/five-point.cpp
five-point(5点アルゴリズム)ってファイル名なのね。

さて、オイラが何でこんなにしつこく勉強しているかというと、画像認識技術を測量ツールとして使いたかったりするのです。

2D→3D復元技術で使われる用語まとめ

2次元の画像から3次元の情報を復元するプログラムを本格的に実装してみようと思って、まずはOpenGVから触り始めたんだけど、オイラの基礎知識が乏し過ぎて苦戦中。まだOpenGVに同梱されているtestコードをいじってみている段階。オイラはこ...

http://pukulab.blog.fc2.com/blog-entry-42.html
http://pukulab.blog.fc2.com/blog-entry-44.html

5点アルゴリズムで推奨されるのは、5点の内の3点が同一平面状にあり、残り2点が任意の位置にあるような条件らしい。

追記：その後、OpenCVの三角測量関数 cv::triangulatepointsもいじってみた↓

OpenCVの三角測量関数『cv::triangulatepoints』

だいぶ時間が空きましたが、引き続きOpenCVの3次元復元系の関数を見ていく。今回はcalib3dモジュールにあるtriangulatePoints関数。つまり三角測量を行う関数ですね。void cv::triangulatePoints(...

Open Shading Language (OSL)

clearcoat Shader

ブログをGoogle App EngineからAmazon EC2へ移行

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

Structure from Motion (多視点画像からの3次元形状復元)

Unity ARKitプラグインサンプルのチュートリアルを読む

Mayaのシェーディングノードの区分

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

課題設定 (Formulation of the problem)

Input

Output

アルゴリズムの概要 (Algorithm Outline)

関連記事

Open Shading Language (OSL)

clearcoat Shader

ブログをGoogle App EngineからAmazon EC2へ移行

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

Structure from Motion (多視点画像からの3次元形状復元)

Unity ARKitプラグインサンプルのチュートリアルを読む

Mayaのシェーディングノードの区分

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

Facebookの顔認証技術『DeepFace』

ZBrushのZScript入門

Netron：機械学習モデルを可視化するツール

今年もSSII

PGGAN：段階的に解像度を上げて学習を進めるGAN

Unityからkonashiをコントロールする

SONYの自律型エンタテインメントロボット『aibo』

オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート

Manim：Pythonで使える数学アニメーションライブラリ

Deep Learningとその他の機械学習手法の性能比較

bpy-renderer：レンダリング用Pythonパッケージ

オープンソースの取引プラットフォーム

MVStudio：オープンソースのPhotogrammetryツール

Unity Scriptコーディング→Unreal Engine Scriptコーディング

Fast R-CNN：ディープラーニングによる一般物体検出手法

動的なメモリの扱い

AMIMOTO（PVM版）で作成したインスタンスをAMIMOTO (HVM版)へ移行する

OpenMVSのサンプルを動かしてみる

WordPress on Google App Engineを1週間運用してみて

Unreal Engineの薄い本

TensorFlowでCGを微分できる『TensorFlow Graphics』

FreeMoCap Project：オープンソースのマーカーレスモーションキャプチャ

iPhoneで3D写真が撮れるアプリ『seene』

Raspberry Piでセンサーの常時稼働を検討する

サンプルコードにも間違いはある？

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

OpenCVでPhotoshopのプラグイン開発

UnityのAR FoundationでARKit 3

OpenVDB：3Dボリュームデータ処理ライブラリ

Amazon Web ServicesでWordPress

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

オーバーロードとオーバーライド

コメント

個人情報に関するお知らせ