OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

本来なら例の書籍を読み進めて少しずつ理解していくつもりだったけど、しんどい。。。

期待していた書籍「3次元コンピュータビジョン計算ハンドブック」がついに発売されたので購入。3次元シーンを撮影した画像を解析して3次元情報を抽出するコンピュータビジョンの基礎技術を記述している．理論は最小限に抑えて，実際にプログラミングするた...

書籍はなかなか読み進められなかったので、飛ばし読みしてプログラムを動かしながら徐々にディティールを理解していく方針へ切り替えた(笑)

何度か格闘するも上手くいかないOpenCVのsfmモジュールのビルドもいったん諦めて、もっとプリミティブな関数をいじってお勉強しようと思う。
以前見つけたこちらのチュートリアルのサンプルコードでfindEssentialMat関数、つまりNist´erの5点アルゴリズムをいじってみる。

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

書籍「ROSではじめるロボットプログラミング」を一通り読み終わって、何となくロボットの自己位置認識の重要性を感じている。ロボット自身の移動量を計測する手法全般を"Odometry"と言うらしい。中でも1番簡単なやり方は、車輪などの駆動装置...

このサンプルコードはヘッダーファイルを含めても300行未満なので読みやすいはず。
https://github.com/avisingh599/mono-vo

このリポジトリのmono-vo/src/visodo.cppを読んでみる。

というか、まずはこのブログ記事を読むところからかな。
http://avisingh599.github.io/vision/monocular-vo/

ブログ記事の一部を雑に日本語訳。

課題設定 (Formulation of the problem)

Input

カメラから取得したグレイスケールのストリーム画像を入力とし、時刻 $t$ , 時刻 $t+1$ の時点で取得した画像をそれぞれ $I^t$ , $I^{t+1}$ と呼びます。カメラの固有パラメータは事前にキャリブレーションによって取得済みです。キャリブレーションはOpenCVでも行うことができます。

Output

全ての画像ペアで、2枚の画像間の車両の移動を表す回転行列 $R$ と並進ベクトル $t$ を求める必要があります。我々の単眼手法では並進ベクトル $t$ のスケール要素までは計算できません。

アルゴリズムの概要 (Algorithm Outline)

画像ペア： $I^t$ , $I^{t+1}$ の取得

上記画像の歪みを補正する。

$I^t$ からFASTアルゴリズムで特徴点を抽出し、それらの特徴点の $I^{t+1}$ までの移動を追跡する。特徴点の数が特定の閾値を下回った場合、新しい特徴点を検出する。

Nisterの5点アルゴリズム(with RANSAC)によってEssential Matrix(基本行列)を算出する。

上記ステップで求めたEssential Matrix(基本行列)から $R$ と $t$ を推定する。

スピードメーター等の外部ソースからスケール情報を取得し、並進ベクトル $t$ と回転行列 $R$ とを連結する。

ということで、詳しく知りたいのは特に4と5の基本行列を求めてそれを回転行列 $R$ と並進ベクトル $t$ へ分解するプロセスです。
サンプルコードで言うとほんの一部。116～119行目の辺りですね↓

  //recovering the pose and the essential matrix
  Mat E, R, t, mask;
  E = findEssentialMat(points2, points1, focal, pp, RANSAC, 0.999, 1.0, mask);
  recoverPose(E, points2, points1, R, t, focal, pp, mask);

findEssentialMatで求めた基本行列を回転行列と並進ベクトルへ分解する関数は上記のrecoverPoseだけじゃなく、decomposeEssentialMatというのも用意されてるんだが、decomposeEssentialMatでは特異値分解で2種類の $R$ と1つの $t$ ( $\pm$ 組み合わせで4つの解)が算出される。
唯一の解を求めたい場合はrecoverPoseに対応点の情報を渡して使う。

ちなみに、findEssentialMat関数の中身のコードはこちら→modules/calib3d/src/five-point.cpp
five-point(5点アルゴリズム)ってファイル名なのね。

さて、オイラが何でこんなにしつこく勉強しているかというと、画像認識技術を測量ツールとして使いたかったりするのです。

2D→3D復元技術で使われる用語まとめ

2次元の画像から3次元の情報を復元するプログラムを本格的に実装してみようと思って、まずはOpenGVから触り始めたんだけど、オイラの基礎知識が乏し過ぎて苦戦中。まだOpenGVに同梱されているtestコードをいじってみている段階。オイラはこ...

http://pukulab.blog.fc2.com/blog-entry-42.html
http://pukulab.blog.fc2.com/blog-entry-44.html

5点アルゴリズムで推奨されるのは、5点の内の3点が同一平面状にあり、残り2点が任意の位置にあるような条件らしい。

追記：その後、OpenCVの三角測量関数 cv::triangulatepointsもいじってみた↓

OpenCVの三角測量関数『cv::triangulatepoints』

だいぶ時間が空きましたが、引き続きOpenCVの3次元復元系の関数を見ていく。今回はcalib3dモジュールにあるtriangulatePoints関数。つまり三角測量を行う関数ですね。void cv::triangulatePoints(...

Mayaのシェーディングノードの区分

フィーリングに基づくタマムシの質感表現

このブログのデザインに飽きてきた

画像生成AI Stable Diffusionで遊ぶ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

Kinect for Windows v2の日本価格決定

Theia：オープンソースのStructure from Motionライブラリ

課題設定 (Formulation of the problem)

Input

Output

アルゴリズムの概要 (Algorithm Outline)

関連記事

Mayaのシェーディングノードの区分

フィーリングに基づくタマムシの質感表現

このブログのデザインに飽きてきた

画像生成AI Stable Diffusionで遊ぶ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

Kinect for Windows v2の日本価格決定

Theia：オープンソースのStructure from Motionライブラリ

書籍『ROSプログラミング』

参考書

Raspberry Pi

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

Mayaのレンダリング アトリビュート

iPhone・iPod touchで動作する知育ロボット『ROMO』

クラスの基本

UnityでTweenアニメーションを実装できる3種類の無料Asset

Seleniumを使ったFXや株の自動取引

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

第1回 3D勉強会＠関東『SLAMチュートリアル大会』

サンプルコードにも間違いはある？

自前のShaderがおかしい件

OpenCVの顔検出過程を可視化した動画

3Dスキャンしたテクスチャから照明を除去するUnityツール『De Lighting tool』

BlenderでPhotogrammetryできるアドオン

ブログが1日ダウンしてました

iPhoneアプリ開発 Xcode 5のお作法

ブログをGoogle App EngineからAmazon EC2へ移行

UnityでPoint Cloudを表示する方法

オープンソースの物理ベースGIレンダラ『appleseed』

ニューラルネットワークで画像分類

MeshLab：3Dオブジェクトの確認・変換に便利なフリーウェア

Blendify：コンピュータービジョン向けBlenderラッパー

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

Iterator

チャットツール用bot開発フレームワーク『Hubot』

オーバーロードとオーバーライド

NumSharp：C#で使えるNumPyライクな数値計算ライブラリ

オープンソースのプリント基板設計ツール『KiCad』

Maya API Reference

Model View Controller

WordPressのテーマを自作する

RefineNet (Multi-Path Refinement Network)：ディープラーニン...

PCA (主成分分析)

コメント

個人情報に関するお知らせ

Mayaのレンダリングアトリビュート