OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

複数枚の2D画像から、カメラの3D姿勢情報と被写体の疎(sparse)な3D点群を推定するのがStructure from Motionという手法。そこで求めたカメラの姿勢、点群の情報を使ってさらに密(dense)な点群を求めるのがMulti-View Stereoという手法。
Structure from Motionのライブラリは結構色々あるみたいなんだけど、そこから密な点群を求めるMulti-View Stereoのライブラリはあんまり見かけないんだよね。(PMVSというツールは有名ですが)

このOpenMVS(Multi-View Stereo)は、名前の通り、密な点群を復元するMulti-View Stereoのアルゴリズムを実装したライブラリ。OpemMVS自体はAGPLライセンスだけど、依存しているサードパーティのライブラリが細々と沢山あり、それぞれのライセンスに従うのでこちらを参照。

OpenMVS

OpenMVS(Multi-View Stereo)は、コンピュータビジョン科学者、特にMulti-View Stereo reconstructionの分野を対象としたライブラリです。
Structure-from-Motionのパイプラインを実装した(OpenMVGなどの)オープンソースプロジェクトを使えば、入力画像セットからカメラの姿勢や疎な3次元点群を復元できますが、それだけではphotogrammetry chain-flowの最後のプロセスが欠けています。OpenMVSは、この最後のプロセス、再構築するシーンの完全なサーフェイスを復元するためのアルゴリズムを提供します。
OpenMVSへの入力はカメラの姿勢セットと疎な点群、OpenMVSからの出力はテクスチャ付きのMeshになります。
このプロジェクトの主な特長は以下の通りです。

  • 密な点群の復元:可能な限り完全・正確な点群を得るための復元
  • Meshの再構築:入力点群から高品質なMesh表面を推定するためのMesh再構築
  • Meshの分割:全てのディティールを復元するためのMesh分割
  • Meshのテクスチャリング:Meshを着色するためのシャープで正確なテクスチャ計算

詳細なドキュメントはWikiをご覧ください。

このライブラリ、OpenMVGのドキュメントで紹介されていたのだ。



OpenMVGのドキュメントによると、OpenMVGとOpenMVSの連携は比較的簡単にできるみたい。
ソースコードはGitHubにある↓
https://github.com/cdcseacave/openMVS

ドキュメントはGitHub上のWikiに↓
https://github.com/cdcseacave/openMVS/wiki

OpenMVGの出力結果をOpenMVSの入力に使う例も載ってる↓

使い方

secene dense

追記:ドキュメントに従ってサンプルを動かしてみた↓


関連資料

Multi-View Stereoについては、毎度おなじみコンピュータビジョン最先端ガイド5と、コンピュータビジョン勉強会@関東の第28回の資料が参考になる。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)




関連記事

Kinect for Windows V2のプレオーダー開始

Unityの各コンポーネント間でのやり取り

仮想関数

顔追跡による擬似3D表示『Dynamic Perspective』

Accord.NET Framework:C#で使える機械学習ライブラリ

UnityのMonoBehaviourクラスをシングルトン化する

DensePose:画像中の人物表面のUV座標を推定する

WebGL開発に関する情報が充実してきている

Managing Software Requirements: A Unified Approach

統計的な顔モデル

Python拡張モジュールのWindows用インストーラー配布サイト

Point Cloud Libraryに動画フォーマットが追加されるらしい

Konashiを買った

MeshroomでPhotogrammetry

UnityのTransformクラスについて調べてみた

iPhone・iPod touchで動作する知育ロボット『ROMO』

OpenMesh:オープンソースの3Dメッシュデータライブラリ

Adobe MAX 2015

Google App Engine上のWordPressでAmazonJSを利用する

スクラッチで既存のキャラクターを立体化したい

機械学習で遊ぶ

Gource:バージョン管理の履歴を可視化するツール

OpenMayaRender

書籍『イラストで学ぶ ディープラーニング』

Iridescence:プロトタイピング向け軽量3D可視化ライブラリ

ニューラルネットワークと深層学習

フィーリングに基づくタマムシの質感表現

3Dスキャンしたテクスチャから照明を除去するUnityツール『De Lighting tool』

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

PyDataTokyo主催のDeep Learning勉強会

DUSt3R:3Dコンピュータービジョンの基盤モデル

OANDAのfxTrade API

手を動かしながら学ぶデータマイニング

Boost オープンソースライブラリ

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

iPhoneで3D写真が撮れるアプリ『seene』

Blendify:コンピュータービジョン向けBlenderラッパー

Raspberry Piでセンサーの常時稼働を検討する

機械学習について最近知った情報

PGGAN:段階的に解像度を上げて学習を進めるGAN

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

コメント

  1. […] がとうございます。 NegativeMindさんありがとうございます。 NegativeMindException | Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』 NegativeMindException | 複数視点画像から3次元形状を復元するラ […]