openMVG:複数視点画像から3次元形状を復元するライブラリ

最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。

この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓



こっちのopenMVG(Multiple View Geometry)は、名前の通り、複数視点から3次元形状を復元するためのオープンソースのライブラリ。(中身の処理はあんまり違いが無い気もする)
ライセンスはMPL(Mozilla Public License)2.0なので、商用利用も可能。

openMVG: “open Multiple View Geometry”

openMVG

“open Multiple View Geometry”は、コンピュータビジョン研究者、特にMultiple View Geometryのコミュニティを対象としたライブラリです。このライブラリは、多視点幾何における古典的な手法を簡単に扱うことができ、多視点幾何の問題を正確に解けるように設計されています。
openMVGのポリシーは「シンプルに保つ、メンテナンス性を保つ」です。OpenMVGは、コミュニティでの変更が行いやすいように、コードの可読性を重視しています。機能とモジュールは全てユニットテスト済みです。このテスト駆動開発によって、コードの動作と再現性を保証します。また、この構造はユーザーが特定の機能を学び、理解する助けとなるでしょう。
より詳しく知りたい場合は、openMVG GitHubのリポジトリをご覧ください。

と、公式ページに書いてあるので、アルゴリズムのお勉強にも有用なのではないでしょうか。公式ドキュメントはこちら



以前Structure from Motionを調べた時にチラホラとopenMVGという名前は聞いてたんだけど、その頃はコンピュータビジョンについて知らなさ過ぎてスルーしちゃってた。



Youtubeを見ると、openMVGとPMVS(Patch-based Multi-view Stereo Software)というツールと併用して3次元復元した動画がいくつかアップされている。





公式ページに

openMVG provides complete Structure from Motion implementations:
a sequential pipeline
a global pipeline

って書いてあるけど、”complete Structire from Motion implementations”ってのはカメラ姿勢と疎な点群の復元までですかね。

追記:openMVGにGUIを付けたツールを見つけた↓


関連記事

BlenderのPython環境にPyTorchをインストールする

HD画質の無駄遣い

書籍『OpenCV 3 プログラミングブック』を購入

Leap MotionでMaya上のオブジェクトを操作できるプラグイン

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール

3分の動画でプログラミングを学習できるサイト『ドットインストール』

PGGAN:段階的に解像度を上げて学習を進めるGAN

書籍『ROSプログラミング』

Unity Scriptコーディング→Unreal Engine Scriptコーディング

konashiのサンプルコードを動かしてみた

OpenCVの三角測量関数『cv::triangulatepoints』

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

MeshLab:3Dオブジェクトの確認・変換に便利なフリーウェア

動的なメモリの扱い

OpenCVでPhotoshopのプラグイン開発

Unity ARKitプラグインサンプルのチュートリアルを読む

Windows10でPyTorchをインストールしてVSCodeで使う

ニューラルネットワークと深層学習

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

libigl:軽量なジオメトリ処理ライブラリ

書籍『仕事ではじめる機械学習』を読みました

TorchStudio:PyTorchのための統合開発環境とエコシステム

C++の抽象クラス

fSpy:1枚の写真からカメラパラメーターを割り出すツール

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

Open Shading Language (OSL)

コンピュータビジョンの技術マップ

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

Accord.NET Framework:C#で使える機械学習ライブラリ

OpenCV 3.1のsfmモジュールのビルド再び

機械学習に役立つPythonライブラリ一覧

Boost オープンソースライブラリ

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

フォトンの放射から格納までを可視化した動画

OpenGVのライブラリ構成

ポリゴン用各種イテレータと関数セット

3Dグラフィックスの入門書

BlenderでPhotogrammetryできるアドオン

OpenCVのバージョン3が正式リリースされたぞ

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

コメント

  1. 千里 より:

    面白いブログ、ありがとうございます。
    OpenMVGについての質問ですが、複数のカメラ画面から室内の立体空間を再現する上、特定の場所にものが置いているかを判別することが可能ですか?もし、可能なら、その場合、カメラの台数や、撮影角度について、要求がありますか?

    • NegativeMind NegativeMind より:

      こんにちは。

      openMVGは画像から3次元形状を復元するためのライブラリですので、「特定の場所に物が置いてあるかを判別する」という目的での使用には適していません。
      要件を聞く限り、単純に2次元の背景差分で対処できる気がします。

      カメラを固定しておけば、「物が無い状態」と「物がある状態」で撮影画像の特定の領域の画素だけが変化しますので、その変化を検出すれば目的を果たせるのでは?

      OpenCVの背景差分機能や、BGSLibraryという背景差分用のライブラリを試してみてはいかがでしょうか?

      • 千里 より:

        早速のご返事、大変ありがとうございます。
        今回対象となっているのは、以下のような駐輪場です。
        http://www.sagamiharashi-machimidori.or.jp/img/uploads/3/20071023093446_1.jpg
        比較的に少ないカメラによって、各場所に自転車が止まっているかを判別したいです。

        自転車が重なっているため、背景差分だけでは、判別しにくいかと考えております。
        撮影場所によりますが、各場所を区切って空間情報を抽出して、その空間にものがあるかを判別できるなら、比較的に判別しやすいかもしれません。
        素人の考えですみませんが、色々と教えて頂ければ、幸いです。

        • NegativeMind NegativeMind より:

          なるほど、自転車の有無を検出したいのですか。確かに背景差分は難しそうですね。
          この場合、画像認識で対処するより、安価な物理的なスイッチ、あるいは距離センサーを各スペースに設置した方が確実な気はします。(お金かかりますね…)

          リンクの画像を見てふと思ったのですが、駐輪場に止まるのが自転車限定であれば、車輪(楕円形状)を検出するのもアリかもしれません。
          利用者がルール通りに駐輪してくれると仮定すると、撮影画像上での車輪(楕円形状)の位置はおおよそ予想がつきますから、その位置にならぶ楕円の数を数えるとか。
          遮蔽の関係で上手く検出できるか保証できませんが、カメラの配置を工夫して自転車の後輪が必ず撮影できるように設置してみれば実験ぐらいはできるかも。

          すみません、ちょっとお役に立ててないかも・・・

          ちなみに、openMVGを使って3次元復元する場合でも、各自転車が重なって写ったままの画像からは正しく形状復元できません。