Alice Vision:オープンソースのPhotogrammetryフレームワーク

3D人-3dnchu-さんでオープンソースのPhotogrammetryアプリケーション「meshroom」とその基盤となっているフレームワーク「Alice Vision」が紹介されていたのでちょっと調べてみた。
http://3dnchu.com/archives/alicevision-meshroom/

AliceVision – Photogrammetric Computer Vision Framework

AliceVision

AliceVisionは3D復元とカメラトラッキングのアルゴリズムを提供するPhotogrammetricコンピュータービジョンフレームワークです。AliceVisionは、state-of-the-artのコンピュータビジョンアルゴリズムを、テスト・分析・再利用可能な強力なソフトウェアのベースとして提供することを目指しています。このプロジェクトはアカデミアと産業のコラボレーションにより、プロダクションでの使用に耐える堅牢性と品質を備えた最先端のアルゴリズムを提供します。

このプロジェクトを基にしたパイプラインとツールの詳細はAliceVisionのWebサイトでご覧ください。

パイプラインによる処理結果はsketchfabを参照してください。

Alice VisionフレームワークのライセンスはMPLv2(Mozilla Public License, version 2.0)とのことで、商用利用は可能だけどソースコードの開示が必要。

COPYING.mdを読むと、Structure from Motionの処理はopenMVG、Multi-View Stereoの処理にはCMPMVSが使われている他、libmvなど色んなサードパーティーのライブラリが使用されている。



また、GitHub上のリポジトリだけでなく、Alice Vision公式のWebサイトがあります↓
https://alicevision.github.io/


スポンサーリンク

関連ライブラリ

関連ライブラリが2つある。

CCTag

CCTag

このライブラリを使用すると、CCTagマーカーを検出・識別することができます。
このマーカシステムは、チャレンジングな撮影条件でもサブピクセル精度の堅牢性を提供します。

CCTagはCVPR 2016で発表された論文”Detection and Accurate Localization of Circular Fiducials under Highly Challenging Conditions“で提案されているマーカー検出システムを実装したライブラリ。
CPUとGPU両方の実装が入っているようです。こちらもMPLv2ライセンス。

PopSIFT

PopSIFT

このライブラリは、SIFT特徴量抽出のGPU実装を提供します。
最近のグラフィックカードなら、HD解像度の画像に対して25fpsのパフォーマンスを発揮できます。

PopSiftはSHIFTをGPUで高速に処理できるライブラリ。
こちらも基本はMPLv2ライセンスだけど、SHIFTは特許で守られているので、その辺の権利が面倒そうですね。

スタンドアローンのアプリケーション

さて、ライセンス的に商用アプリケーションに組み込みづらいAlice Visionフレームワークですが、公式にフレームワークを使用したソフトウェアが公開されている。もちろんオープンソース。
ただ、meshroom以外はソースコードのみの公開なので、自前でビルドしないと使えません。そのうちビルド済みのバイナリが配布されると良いですね。

meshroom


meshroomは、AliceVisionフレームワークを使った無料でオープンソースの3D復元ソフトウェアです。


スポンサーリンク

meshroomはAliceVisionフレームワークをベースにしたスタンドアローンなPhotogrammetryアプリケーション。3D人-3dnchu-さんではメインで紹介されていました。
無料で使えるPhotogrammetryツールなので色々と可能性が広がりますね。meshroomはダウンロードページでWindows, Linux用にビルド済みのパッケージが配布されている。

2019年6月 追記:使ってみた↓


DCCツール向けプラグイン

その他、各DCCツールアプリケーション向けのプラグインもある。

MeshroomMaya

MeshroomMaya

MeshroomMayaによって、グラフィックアーティスト達は画像からピクセル精度での3D復元モデリング(点群とカメラ)が可能になります。

MeshroomMayaは複数枚画像から3Dモデルを作成できるMayaプラグイン。旧名はMayaMVGだったんですね。

ofxMVG

ofxMVG

このプラグインは、meshroomで3D復元されたシーンからカメラの姿勢を推定します。

ofxMVGはNuke用プラグインで、OpenFX規格に対応している。

Houdini用AliceVisionプラグイン

Houdini用のAliceVisionプラグインもある。(Windowsのみ)

AliceVision は、3D再構成およびカメラ追跡アルゴリズムを提供するフォトグラメトリコンピュータビジョンフレームワークで 、こちらに概要が出ている研究者と開発者によって Github で提供されています。
そのコマンドライン機能により、Houdini の無償の GameDevelopmentToolset の一部として利用可能になりました。
AliceVision MPL2 によってライセンスされています。

Photogrammetryのパイプライン

Alice VisionのサイトでPhotogrammetryのパイプラインを解説しているページが分かりやすかったので引用↓

Photogrammetry Pipeline

Photogrammetryは複数の写真から測量する技術です。
Photogrammetryでは、順序付けされていない複数枚の写真やビデオのセットからシーンのジオメトリを推定します。
写真は3Dシーンを2D平面に投影したものであり、奥行き情報を失っています。この投影プロセスの逆行がPhotogrammetryの目標となります。

  1. Natural Feature Extraction
  2. Image Matching
  3. Features Matching
  4. Structure from Motion
  5. Depth maps estimation
  6. Meshing
  7. Texturing
  8. Localization

2021年追記:MeshroomからBlenderにインポートするためのアドオンもある↓

meshroom2blender



Blender importer of AliceVision Meshroom datafiles: cameras, images, sparse pointcloud and obj’s.
Basic implementation of meshroom importer. If you have sphisticated node three it will use only the first nodes from the file. Addon assumes you did compute each stages/nodes, and the output is same.


スポンサーリンク

関連記事

CGALDotNet:計算幾何学ライブラリ CGALのC#ラッパー
ManimML:機械学習の概念を視覚的に説明するためのライブラリ
OpenCV
マルコフ連鎖モンテカルロ法
プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)
BlenderのRigifyでリギング
IronPythonを使ってUnity上でPythonのコードを実行する
HD画質の無駄遣い その2
Maya LTのQuick Rigを試す
ニューラルネットワークで画像分類
ZBrushで仮面ライダー3号を造る 仮面編 Dam Standardブラシでディティールを彫る
python-twitterで自分のお気に入りを取得する
MLDemos:機械学習について理解するための可視化ツール
ZBrushでアヴァン・ガメラを作ってみる おでこ(?)のバランス調整
Raspberry Piでセンサーの常時稼働を検討する
ZBrushでアヴァン・ガメラを作ってみる 下アゴと頭部を作り込む
『スター・ウォーズ 最後のジェダイ』のVFXブレイクダウン まとめ
ZBrushでアヴァン・ガメラを作ってみる パーツ分割
WebGL開発に関する情報が充実してきている
GoogleのDeep Learning論文
Unityで学ぶC#
ZBrush 4R7
ZBrushの練習 手のモデリング
Facebookの顔認証技術『DeepFace』
OpenGVのライブラリ構成
PyDataTokyo主催のDeep Learning勉強会
ZBrushでUndo Historyを動画に書き出す
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...
OpenCVでiPhone6sのカメラをキャリブレーションする
『スター・ウォーズ/スカイウォーカーの夜明け』のVFXブレイクダウン
ZBrushのTranspose Masterでポーズを付ける
Unityの各コンポーネント間でのやり取り
OpenGVの用語
プログラミングスキルとは何か?
『ピクサー展』へ行ってきた
ジュラシック・パークの続編『ジュラシック・ワールド』
Houdiniのライセンスの種類
フルCGのウルトラマン!?
Super Resolution:OpenCVの超解像処理モジュール
Theia:オープンソースのStructure from Motionライブラリ
統計的な顔モデル

コメント