OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

複数枚の2D画像から、カメラの3D姿勢情報と被写体の疎(sparse)な3D点群を推定するのがStructure from Motionという手法。そこで求めたカメラの姿勢、点群の情報を使ってさらに密(dense)な点群を求めるのがMulti-View Stereoという手法。
Structure from Motionのライブラリは結構色々あるみたいなんだけど、そこから密な点群を求めるMulti-View Stereoのライブラリはあんまり見かけないんだよね。(PMVSというツールは有名ですが)

このOpenMVS(Multi-View Stereo)は、名前の通り、密な点群を復元するMulti-View Stereoのアルゴリズムを実装したライブラリ。OpemMVS自体はAGPLライセンスだけど、依存しているサードパーティのライブラリが細々と沢山あり、それぞれのライセンスに従うのでこちらを参照。

OpenMVS

OpenMVS(Multi-View Stereo)は、コンピュータビジョン科学者、特にMulti-View Stereo reconstructionの分野を対象としたライブラリです。
Structure-from-Motionのパイプラインを実装した(OpenMVGなどの)オープンソースプロジェクトを使えば、入力画像セットからカメラの姿勢や疎な3次元点群を復元できますが、それだけではphotogrammetry chain-flowの最後のプロセスが欠けています。OpenMVSは、この最後のプロセス、再構築するシーンの完全なサーフェイスを復元するためのアルゴリズムを提供します。
OpenMVSへの入力はカメラの姿勢セットと疎な点群、OpenMVSからの出力はテクスチャ付きのMeshになります。
このプロジェクトの主な特長は以下の通りです。

  • 密な点群の復元:可能な限り完全・正確な点群を得るための復元
  • Meshの再構築:入力点群から高品質なMesh表面を推定するためのMesh再構築
  • Meshの分割:全てのディティールを復元するためのMesh分割
  • Meshのテクスチャリング:Meshを着色するためのシャープで正確なテクスチャ計算

詳細なドキュメントはWikiをご覧ください。

このライブラリ、OpenMVGのドキュメントで紹介されていたのだ。



OpenMVGのドキュメントによると、OpenMVGとOpenMVSの連携は比較的簡単にできるみたい。
ソースコードはGitHubにある↓
https://github.com/cdcseacave/openMVS

ドキュメントはGitHub上のWikiに↓
https://github.com/cdcseacave/openMVS/wiki

OpenMVGの出力結果をOpenMVSの入力に使う例も載ってる↓

使い方

secene dense

追記:ドキュメントに従ってサンプルを動かしてみた↓


関連資料

Multi-View Stereoについては、毎度おなじみコンピュータビジョン最先端ガイド5と、コンピュータビジョン勉強会@関東の第28回の資料が参考になる。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)




関連記事

pythonもかじってみようかと

Unityの各コンポーネント間でのやり取り

画像生成AI Stable Diffusionで遊ぶ

OpenCVでPhotoshopのプラグイン開発

今年もSSII

自前のShaderがおかしい件

CGのためのディープラーニング

cvui:OpenCVのための軽量GUIライブラリ

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

WordPressプラグインの作り方

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

HerokuでMEAN stack

SONY製のニューラルネットワークライブラリ『NNabla』

OpenCVの超解像(SuperResolution)モジュールを試す

html5のcanvasの可能性

Webサイトのワイヤーフレームが作成できるオンラインツール

U-Net:ディープラーニングによるSemantic Segmentation手法

CGAN (Conditional GAN):条件付き敵対的生成ネットワーク

BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール

OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...

Python for Unity:UnityEditorでPythonを使えるパッケージ

OpenCVで顔のランドマークを検出する『Facemark API』

iPhoneで3D写真が撮れるアプリ『seene』

参考書

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

MRenderUtil::raytrace

MeshLab:3Dオブジェクトの確認・変換に便利なフリーウェア

Python拡張モジュールのWindows用インストーラー配布サイト

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

UnityでLight Shaftを表現する

Russian3DScannerのトポロジー転送ツール『WrapX』

第1回 3D勉強会@関東『SLAMチュートリアル大会』

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

仮想関数

Deep Fluids:流体シミュレーションをディープラーニングで近似する

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

科学技術計算向けスクリプト言語『Julia』

fSpy:1枚の写真からカメラパラメーターを割り出すツール

書籍『ROSプログラミング』

コメント

  1. […] がとうございます。 NegativeMindさんありがとうございます。 NegativeMindException | Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』 NegativeMindException | 複数視点画像から3次元形状を復元するラ […]