OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

数度のトライを経て、OpenCVのバージョン3.3.0でやっとsfmモジュールのビルドが通ったわけです。



ようやくサンプルを試す段階に来た。参考にしてるQiita記事後編へやっと進める。↓
http://qiita.com/ChaoticActivity/items/178d23508b92a09e59ea

記事によると、サンプルを動かすためにまたいくつか手を加える必要がある(笑)


ヘッダーファイルの修正

さて、opencv_contrib-3.3.0/modules/sfm/samples以下にあるsfmのサンプルをそのままビルドしようとすると

reconstruct()が定義されていません

的なエラーが出る。
このエラーの理由は、いくつかのヘッダーファイルで

#if CERES_FOUND

という条件マクロが書かれており、Ceres-Solverの有無でincludeするファイルを選択しているから。なので、この条件がtrueになるようにコンパイラにCeres-Solverが存在することを知らせる必要がある。

で、ちょっと行儀が悪いけど、オイラはもうinclude/opencv2/sfm.hppの冒頭の以下の記述を

#ifndef __OPENCV_SFM_HPP__
#define __OPENCV_SFM_HPP__

#include <opencv2/sfm/conditioning.hpp>
#include <opencv2/sfm/fundamental.hpp>
#include <opencv2/sfm/numeric.hpp>
#include <opencv2/sfm/projection.hpp>
#include <opencv2/sfm/triangulation.hpp>
#if CERES_FOUND
#include <opencv2/sfm/reconstruct.hpp>
#include <opencv2/sfm/simple_pipeline.hpp>
#endif

直接以下のように編集しちゃいました。

#ifndef __OPENCV_SFM_HPP__
#define __OPENCV_SFM_HPP__

#include 
#include 
#include 
#include 
#include 
#include 

#define CERES_FOUND 1

#if CERES_FOUND
#include 
#include 
#endif

サンプルコードの実行

参考記事に倣ってtrajectory_reconstruccion.cppを実行してみる。

おお、特にエラーも無く動作したぞ!



サンプルコードのバグ修正

参考記事によると、このサンプルコードにはバグがあるというか、カメラの軌跡を表示する際に使用しているcv::viz::WTrajectoryに渡す引数が間違っているらしい。
以下の部分を

/// Recovering cameras
  cout << "Recovering cameras ... ";

  vector<Affine3d> path_est;
  for (size_t i = 0; i < Rs_est.size(); ++i)
    path_est.push_back(Affine3d(Rs_est[i],ts_est[i]));

  cout << "[DONE]" << endl;

逆行列に変えて以下のようにすると正しい座標変換になる。

/// Recovering cameras
  cout << "Recovering cameras ... ";

  vector<Affine3d> path_est;
  for (size_t i = 0; i < Rs_est.size(); ++i)
    path_est.push_back(Affine3d(Rs_est[i], ts_est[i]).inv());

  cout << "[DONE]" << endl;

別のサンプルコード

調子に乗ってscene_reconstruction.cppも動かしてみようと思ったら見事エラー…
http://docs.opencv.org/3.3.0/d4/d18/tutorial_sfm_scene_reconstruction.html

え、正しいコマンドライン引数が良く分からんぞ。。。

関連記事

Paul Debevec

WebGL開発に関する情報が充実してきている

RefineNet (Multi-Path Refinement Network):ディープラーニン...

Facebookの顔認証技術『DeepFace』

DensePose:画像中の人物表面のUV座標を推定する

Pythonのソースコードに特化した検索エンジン『Nullege』

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

UnityでARKit2.0

ベイズ推定とグラフィカルモデル

trimesh:PythonでポリゴンMeshを扱うライブラリ

UnityのAR FoundationでARKit 3

Windows10でPyTorchをインストールしてVSCodeで使う

KelpNet:C#で使える可読性重視のディープラーニングライブラリ

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

Unityの各コンポーネント間でのやり取り

OpenCV 3.3.0-RCでsfmモジュールをビルド

Mitsuba 2:オープンソースの物理ベースレンダラ

Amazon Web ServicesでWordPress

Webサイトのワイヤーフレームが作成できるオンラインツール

OpenCVで顔のランドマークを検出する『Facemark API』

機械学習に役立つPythonライブラリ一覧

Unityの薄い本

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

3分の動画でプログラミングを学習できるサイト『ドットインストール』

動的なメモリの扱い

Mitsuba 3:オープンソースの研究向けレンダラ

openMVG:複数視点画像から3次元形状を復元するライブラリ

Raspberry Pi 2のGPIOピン配置

C++の抽象クラス

OpenAR:OpenCVベースのマーカーARライブラリ

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

Autodesk Mementoでゴジラを3次元復元する

オープンソースの顔認識フレームワーク『OpenBR』

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

OpenCVの超解像(SuperResolution)モジュールを試す

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ

顔画像処理技術の過去の研究

Fast R-CNN:ディープラーニングによる一般物体検出手法

Google App Engineのデプロイ失敗

OpenMesh:オープンソースの3Dメッシュデータライブラリ

PGGAN:段階的に解像度を上げて学習を進めるGAN

コメント