OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

複数枚の2D画像から、カメラの3D姿勢情報と被写体の疎(sparse)な3D点群を推定するのがStructure from Motionという手法。そこで求めたカメラの姿勢、点群の情報を使ってさらに密(dense)な点群を求めるのがMulti-View Stereoという手法。
Structure from Motionのライブラリは結構色々あるみたいなんだけど、そこから密な点群を求めるMulti-View Stereoのライブラリはあんまり見かけないんだよね。(PMVSというツールは有名ですが)

このOpenMVS(Multi-View Stereo)は、名前の通り、密な点群を復元するMulti-View Stereoのアルゴリズムを実装したライブラリ。OpemMVS自体はAGPLライセンスだけど、依存しているサードパーティのライブラリが細々と沢山あり、それぞれのライセンスに従うのでこちらを参照。

OpenMVS

OpenMVS(Multi-View Stereo)は、コンピュータビジョン科学者、特にMulti-View Stereo reconstructionの分野を対象としたライブラリです。
Structure-from-Motionのパイプラインを実装した(OpenMVGなどの)オープンソースプロジェクトを使えば、入力画像セットからカメラの姿勢や疎な3次元点群を復元できますが、それだけではphotogrammetry chain-flowの最後のプロセスが欠けています。OpenMVSは、この最後のプロセス、再構築するシーンの完全なサーフェイスを復元するためのアルゴリズムを提供します。
OpenMVSへの入力はカメラの姿勢セットと疎な点群、OpenMVSからの出力はテクスチャ付きのMeshになります。
このプロジェクトの主な特長は以下の通りです。

  • 密な点群の復元:可能な限り完全・正確な点群を得るための復元
  • Meshの再構築:入力点群から高品質なMesh表面を推定するためのMesh再構築
  • Meshの分割:全てのディティールを復元するためのMesh分割
  • Meshのテクスチャリング:Meshを着色するためのシャープで正確なテクスチャ計算

詳細なドキュメントはWikiをご覧ください。


スポンサーリンク

このライブラリ、OpenMVGのドキュメントで紹介されていたのだ。


スポンサーリンク


OpenMVGのドキュメントによると、OpenMVGとOpenMVSの連携は比較的簡単にできるみたい。
ソースコードはGitHubにある↓
https://github.com/cdcseacave/openMVS

ドキュメントはGitHub上のWikiに↓
https://github.com/cdcseacave/openMVS/wiki

OpenMVGの出力結果をOpenMVSの入力に使う例も載ってる↓

使い方

secene dense

追記:ドキュメントに従ってサンプルを動かしてみた↓


関連資料

Multi-View Stereoについては、毎度おなじみコンピュータビジョン最先端ガイド5と、コンピュータビジョン勉強会@関東の第28回の資料が参考になる。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)





スポンサーリンク

関連記事

openMVGをWindows10 Visual Studio 2015環境でビルドする
Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法
GeoGebra:無料で使える数学アプリ
ブラウザ操作自動化ツール『Selenium』を試す
Kaolin:3Dディープラーニング用のPyTorchライブラリ
Verilog HDL
機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...
fSpy:1枚の写真からカメラパラメーターを割り出すツール
オープンソースのプリント基板設計ツール『KiCad』
OpenCV 3.3.0-RCでsfmモジュールをビルド
統計的な顔モデル
BlenderでPhotogrammetryできるアドオン
Mayaのプラグイン開発
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
OpenSfM:PythonのStructure from Motionライブラリ
3分の動画でプログラミングを学習できるサイト『ドットインストール』
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
WordPressのテーマを自作する
海外ドラマのChromaKey
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
FCN (Fully Convolutional Network):ディープラーニングによるSema...
ベイズ推定とグラフィカルモデル
プログラミングスキルとは何か?
フィーリングに基づくタマムシの質感表現
Open3D:3Dデータ処理ライブラリ
OpenMayaRender
Python.NET:Pythonと.NETを連携させるパッケージ
動的なメモリの扱い
Googleが画像解析旅行ガイドアプリのJetpac社を買収
機械学習手法『Random Forest』
オープンソースの顔認識フレームワーク『OpenBR』
OpenCLに対応したオープンソースの物理ベースレンダラ『LuxRender(ルクスレンダー)』
インタラクティブにComputer Visionコーディングができるツール『Live CV』
iOSで使えるJetpac社の物体認識SDK『DeepBelief』
ArUco:OpenCVベースのコンパクトなARライブラリ
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
CGAN (Conditional GAN):条件付き敵対的生成ネットワーク
ポイントクラウドコンソーシアム
MLDemos:機械学習について理解するための可視化ツール
Qlone:スマホのカメラで3Dスキャンできるアプリ
KelpNet:C#で使える可読性重視のディープラーニングライブラリ

コメント

  1. […] がとうございます。 NegativeMindさんありがとうございます。 NegativeMindException | Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』 NegativeMindException | 複数視点画像から3次元形状を復元するラ […]