Alice Vision:オープンソースのPhotogrammetryフレームワーク

3D人-3dnchu-さんでオープンソースのPhotogrammetryアプリケーション「meshroom」とその基盤となっているフレームワーク「Alice Vision」が紹介されていたのでちょっと調べてみた。
http://3dnchu.com/archives/alicevision-meshroom/

AliceVision – Photogrammetric Computer Vision Framework

AliceVision

AliceVisionは3D復元とカメラトラッキングのアルゴリズムを提供するPhotogrammetricコンピュータービジョンフレームワークです。AliceVisionは、state-of-the-artのコンピュータビジョンアルゴリズムを、テスト・分析・再利用可能な強力なソフトウェアのベースとして提供することを目指しています。このプロジェクトはアカデミアと産業のコラボレーションにより、プロダクションでの使用に耐える堅牢性と品質を備えた最先端のアルゴリズムを提供します。

このプロジェクトを基にしたパイプラインとツールの詳細はAliceVisionのWebサイトでご覧ください。

パイプラインによる処理結果はsketchfabを参照してください。

Alice VisionフレームワークのライセンスはMPLv2(Mozilla Public License, version 2.0)とのことで、商用利用は可能だけどソースコードの開示が必要。

COPYING.mdを読むと、Structure from Motionの処理はopenMVG、Multi-View Stereoの処理にはCMPMVSが使われている他、libmvなど色んなサードパーティーのライブラリが使用されている。



また、GitHub上のリポジトリだけでなく、Alice Vision公式のWebサイトがあります↓
https://alicevision.github.io/


スポンサーリンク

関連ライブラリ

関連ライブラリが2つある。

CCTag

CCTag

このライブラリを使用すると、CCTagマーカーを検出・識別することができます。
このマーカシステムは、チャレンジングな撮影条件でもサブピクセル精度の堅牢性を提供します。

CCTagはCVPR 2016で発表された論文”Detection and Accurate Localization of Circular Fiducials under Highly Challenging Conditions“で提案されているマーカー検出システムを実装したライブラリ。
CPUとGPU両方の実装が入っているようです。こちらもMPLv2ライセンス。

PopSIFT

PopSIFT

このライブラリは、SIFT特徴量抽出のGPU実装を提供します。
最近のグラフィックカードなら、HD解像度の画像に対して25fpsのパフォーマンスを発揮できます。

PopSiftはSHIFTをGPUで高速に処理できるライブラリ。
こちらも基本はMPLv2ライセンスだけど、SHIFTは特許で守られているので、その辺の権利が面倒そうですね。

スタンドアローンのアプリケーション

さて、ライセンス的に商用アプリケーションに組み込みづらいAlice Visionフレームワークですが、公式にフレームワークを使用したソフトウェアが公開されている。もちろんオープンソース。
ただ、meshroom以外はソースコードのみの公開なので、自前でビルドしないと使えません。そのうちビルド済みのバイナリが配布されると良いですね。

meshroom



スポンサーリンク

meshroomは、AliceVisionフレームワークを使った無料でオープンソースの3D復元ソフトウェアです。

meshroomはAliceVisionフレームワークをベースにしたスタンドアローンなPhotogrammetryアプリケーション。3D人-3dnchu-さんではメインで紹介されていました。
無料で使えるPhotogrammetryツールなので色々と可能性が広がりますね。meshroomはダウンロードページでWindows, Linux用にビルド済みのパッケージが配布されている。

2019年6月 追記:使ってみた↓


DCCツール向けプラグイン

その他、各DCCツールアプリケーション向けのプラグインもある。

MeshroomMaya

MeshroomMaya

MeshroomMayaによって、グラフィックアーティスト達は画像からピクセル精度での3D復元モデリング(点群とカメラ)が可能になります。

MeshroomMayaは複数枚画像から3Dモデルを作成できるMayaプラグイン。旧名はMayaMVGだったんですね。

ofxMVG

ofxMVG

このプラグインは、meshroomで3D復元されたシーンからカメラの姿勢を推定します。

ofxMVGはNuke用プラグインで、OpenFX規格に対応している。

Houdini用AliceVisionプラグイン

Houdini用のAliceVisionプラグインもある。(Windowsのみ)

AliceVision は、3D再構成およびカメラ追跡アルゴリズムを提供するフォトグラメトリコンピュータビジョンフレームワークで 、こちらに概要が出ている研究者と開発者によって Github で提供されています。
そのコマンドライン機能により、Houdini の無償の GameDevelopmentToolset の一部として利用可能になりました。
AliceVision MPL2 によってライセンスされています。


Photogrammetryのパイプライン

Alice VisionのサイトでPhotogrammetryのパイプラインを解説しているページが分かりやすかったので引用↓

Photogrammetry Pipeline

Photogrammetryは複数の写真から測量する技術です。
Photogrammetryでは、順序付けされていない複数枚の写真やビデオのセットからシーンのジオメトリを推定します。
写真は3Dシーンを2D平面に投影したものであり、奥行き情報を失っています。この投影プロセスの逆行がPhotogrammetryの目標となります。

  1. Natural Feature Extraction
  2. Image Matching
  3. Features Matching
  4. Structure from Motion
  5. Depth maps estimation
  6. Meshing
  7. Texturing
  8. Localization

2021年追記:MeshroomからBlenderにインポートするためのアドオンもある↓

meshroom2blender



Blender importer of AliceVision Meshroom datafiles: cameras, images, sparse pointcloud and obj’s.
Basic implementation of meshroom importer. If you have sphisticated node three it will use only the first nodes from the file. Addon assumes you did compute each stages/nodes, and the output is same.


スポンサーリンク

関連記事

統計的な顔モデル
単純に遊びに行くのはだめなのか?
IronPythonを使ってUnity上でPythonのコードを実行する
ReadCube:文献管理ツール
3Dモデルを立体視で確認できるVRアプリを作っている
ManimML:機械学習の概念を視覚的に説明するためのライブラリ
Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法
書籍『メイキング・オブ・ピクサー 創造力をつくった人々』を読んだ
ゴジラ三昧
Webサイトのワイヤーフレームが作成できるオンラインツール
MFnMeshクラスのsplit関数
OpenMVSのサンプルを動かしてみる
MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト
ポリ男をリファイン
ZBrushで仮面ライダー3号を造る 仮面編 DynaMesh
ZBrushでカスタムUIを設定する
MPFB2:Blenderの人体モデリングアドオン
オーバーロードとオーバーライド
PGGAN:段階的に解像度を上げて学習を進めるGAN
ZBrushでアヴァン・ガメラを作ってみる 頭頂部の作り込み・舌の追加
Open Shading Language (OSL)
『ピクサー展』へ行ってきた
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
SculptrisとBlenderで作ったGodzilla 2014 (Fan Made)
Texturing & Modeling A Procedural ApproachをGoo...
Stanford Bunny
After Effects全エフェクトの解説(6.5)
プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)
ゴジラ(2014)のメイキング
3Dグラフィックスの入門書
畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...
Unite 2014の動画
OpenCLに対応したオープンソースの物理ベースレンダラ『LuxRender(ルクスレンダー)』
CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
fSpy:1枚の写真からカメラパラメーターを割り出すツール
Open3D:3Dデータ処理ライブラリ
Raytracing Wiki
画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...
PolyPaint
Unreal Engine 5の情報が公開された!
C++の抽象クラス
ニューラルネットワークで画像分類

コメント