サイトアイコン NegativeMindException

OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

複数枚の2D画像から、カメラの3D姿勢情報と被写体の疎(sparse)な3D点群を推定するのがStructure from Motionという手法。そこで求めたカメラの姿勢、点群の情報を使ってさらに密(dense)な点群を求めるのがMulti-View Stereoという手法。
Structure from Motionのライブラリは結構色々あるみたいなんだけど、そこから密な点群を求めるMulti-View Stereoのライブラリはあんまり見かけないんだよね。(PMVSというツールは有名ですが)

このOpenMVS(Multi-View Stereo)は、名前の通り、密な点群を復元するMulti-View Stereoのアルゴリズムを実装したライブラリ。OpemMVS自体はAGPLライセンスだけど、依存しているサードパーティのライブラリが細々と沢山あり、それぞれのライセンスに従うのでこちらを参照。

OpenMVS

OpenMVS(Multi-View Stereo)は、コンピュータビジョン科学者、特にMulti-View Stereo reconstructionの分野を対象としたライブラリです。
Structure-from-Motionのパイプラインを実装した(OpenMVGなどの)オープンソースプロジェクトを使えば、入力画像セットからカメラの姿勢や疎な3次元点群を復元できますが、それだけではphotogrammetry chain-flowの最後のプロセスが欠けています。OpenMVSは、この最後のプロセス、再構築するシーンの完全なサーフェイスを復元するためのアルゴリズムを提供します。
OpenMVSへの入力はカメラの姿勢セットと疎な点群、OpenMVSからの出力はテクスチャ付きのMeshになります。
このプロジェクトの主な特長は以下の通りです。

  • 密な点群の復元:可能な限り完全・正確な点群を得るための復元
  • Meshの再構築:入力点群から高品質なMesh表面を推定するためのMesh再構築
  • Meshの分割:全てのディティールを復元するためのMesh分割
  • Meshのテクスチャリング:Meshを着色するためのシャープで正確なテクスチャ計算

詳細なドキュメントはWikiをご覧ください。


スポンサーリンク

このライブラリ、OpenMVGのドキュメントで紹介されていたのだ。



OpenMVGのドキュメントによると、OpenMVGとOpenMVSの連携は比較的簡単にできるみたい。
ソースコードはGitHubにある↓
https://github.com/cdcseacave/openMVS

ドキュメントはGitHub上のWikiに↓
https://github.com/cdcseacave/openMVS/wiki

OpenMVGの出力結果をOpenMVSの入力に使う例も載ってる↓

使い方



追記:ドキュメントに従ってサンプルを動かしてみた↓


関連資料

Multi-View Stereoについては、毎度おなじみコンピュータビジョン最先端ガイド5と、コンピュータビジョン勉強会@関東の第28回の資料が参考になる。







スポンサーリンク

関連記事

  • 網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した
  • 機械学習手法『Random Forest』
  • 動的なメモリの扱い
  • OpenCVの超解像(SuperResolution)モジュールを試す
  • Iterator
  • 統計的な顔モデル
  • OpenCV 3.3.0-RCでsfmモジュールをビルド
  • Raspberry Piでセンサーの常時稼働を検討する
  • iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
  • オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う
  • ZBrushのZScript入門
  • Runway ML:クリエイターのための機械学習ツール
  • プログラムによる景観の自動生成
  • 3Dモデルを立体視で確認できるVRアプリを作っている
  • Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
  • BlenderのPython環境にPyTorchをインストールする
  • クラスの基本
  • C++ 標準テンプレートライブラリ (STL)
  • MVStudio:オープンソースのPhotogrammetryツール
  • UnityでShaderの入力パラメータとして行列を渡す
  • UnityのTransformクラスについて調べてみた
  • 3D復元技術の情報リンク集
  • 顔追跡による擬似3D表示『Dynamic Perspective』
  • Unityで学ぶC#
  • Open Shading Language (OSL)
  • Netron:機械学習モデルを可視化するツール
  • ROSの薄い本
  • 組み込み向けのWindows OS 『Windows Embedded』
  • Mayaのプラグイン開発
  • 定数
  • PCA (主成分分析)
  • Mitsuba 3:オープンソースの研究向けレンダラ
  • Javaで作られたオープンソースの3DCGレンダラ『Sunflow』
  • オーバーロードとオーバーライド
  • Polyscope:3Dデータ操作用GUIライブラリ
  • PyTorch3D:3Dコンピュータービジョンライブラリ
  • Manim:Pythonで使える数学アニメーションライブラリ
  • 機械学習に役立つPythonライブラリ一覧
  • TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
  • iPhone・iPod touchで動作する知育ロボット『ROMO』
  • 3Dスキャンに基づくプロシージャルフェイシャルアニメーション
  • OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ
  • モバイルバージョンを終了