openMVG：複数視点画像から3次元形状を復元するライブラリ

最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。

この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓

2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた↓The OpenGV libraryOpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的に行うために設...

こっちのopenMVG(Multiple View Geometry)は、名前の通り、複数視点から3次元形状を復元するためのオープンソースのライブラリ。(中身の処理はあんまり違いが無い気もする)
ライセンスはMPL(Mozilla Public License)2.0なので、商用利用も可能。

openMVG: “open Multiple View Geometry”

“open Multiple View Geometry”は、コンピュータビジョン研究者、特にMultiple View Geometryのコミュニティを対象としたライブラリです。このライブラリは、多視点幾何における古典的な手法を簡単に扱うことができ、多視点幾何の問題を正確に解けるように設計されています。
openMVGのポリシーは「シンプルに保つ、メンテナンス性を保つ」です。OpenMVGは、コミュニティでの変更が行いやすいように、コードの可読性を重視しています。機能とモジュールは全てユニットテスト済みです。このテスト駆動開発によって、コードの動作と再現性を保証します。また、この構造はユーザーが特定の機能を学び、理解する助けとなるでしょう。
より詳しく知りたい場合は、openMVG GitHubのリポジトリをご覧ください。

と、公式ページに書いてあるので、アルゴリズムのお勉強にも有用なのではないでしょうか。公式ドキュメントはこちら。

以前Structure from Motionを調べた時にチラホラとopenMVGという名前は聞いてたんだけど、その頃はコンピュータビジョンについて知らなさ過ぎてスルーしちゃってた。

Structure from Motion (多視点画像からの3次元形状復元)

3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

Youtubeを見ると、openMVGとPMVS(Patch-based Multi-view Stereo Software)というツールと併用して3次元復元した動画がいくつかアップされている。

公式ページに

openMVG provides complete Structure from Motion implementations:
a sequential pipeline
a global pipeline

って書いてあるけど、”complete Structire from Motion implementations”ってのはカメラ姿勢と疎な点群の復元までですかね。

追記：openMVGにGUIを付けたツールを見つけた↓

Regard3D：オープンソースのStructure from Motionツール

ライブラリではなく、ちゃんとGUIを備えたオープンソースのStructure from Motionのアプリケーションを見つけた。このRegard3DのソースコードはMIT licenseだそうだ。Regard3DRegard3Dは、無料で...

Python拡張モジュールのWindows用インストーラー配布サイト

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

1枚の画像からマテリアルを作成できる無料ツール『Materialize』

ブラウザ操作自動化ツール『Selenium』を試す

pythonもかじってみようかと

MRenderUtil::raytrace

Raspberry Pi

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

書籍『OpenCV 3 プログラミングブック』を購入

SDカードサイズのコンピューター『Intel Edison』

Multi-View Environment：複数画像から3次元形状を再構築するライブラリ

第25回コンピュータビジョン勉強会＠関東に行って来た

まだ続くブログの不調

PythonでMayaのShapeノードプラグインを作る

RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』

顔追跡による擬似3D表示『Dynamic Perspective』

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

WordPressのテーマを自作する

iPhone・iPod touchで動作する知育ロボット『ROMO』

チャットツール用bot開発フレームワーク『Hubot』

Googleが画像解析旅行ガイドアプリのJetpac社を買収

html5のcanvasの可能性

OpenSfM：PythonのStructure from Motionライブラリ

プログラミングスキルとは何か？

マルコフ連鎖モンテカルロ法

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

OpenCV 3.1のsfmモジュールを試す

CNN Explainer：畳み込みニューラルネットワーク可視化ツール

Active Appearance Models（AAM）

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

TensorFlowでCGを微分できる『TensorFlow Graphics』

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

立体視を試してみた

ポイントクラウドコンソーシアム

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

adskShaderSDK

OpenCVでPhotoshopのプラグイン開発

PyDataTokyo主催のDeep Learning勉強会

Mean Stack開発の最初の一歩

Structure from Motion (多視点画像からの3次元形状復元)

Seleniumを使ったFXや株の自動取引

千里より:

2017年2月25日 12:19 PM

面白いブログ、ありがとうございます。
OpenMVGについての質問ですが、複数のカメラ画面から室内の立体空間を再現する上、特定の場所にものが置いているかを判別することが可能ですか？もし、可能なら、その場合、カメラの台数や、撮影角度について、要求がありますか？

返信

NegativeMind より:

2017年2月25日 1:00 PM

こんにちは。

openMVGは画像から3次元形状を復元するためのライブラリですので、「特定の場所に物が置いてあるかを判別する」という目的での使用には適していません。
要件を聞く限り、単純に2次元の背景差分で対処できる気がします。

カメラを固定しておけば、「物が無い状態」と「物がある状態」で撮影画像の特定の領域の画素だけが変化しますので、その変化を検出すれば目的を果たせるのでは？

OpenCVの背景差分機能や、BGSLibraryという背景差分用のライブラリを試してみてはいかがでしょうか？

読み込み中…

返信
- 千里より:
  
  2017年2月25日 1:13 PM
  
  早速のご返事、大変ありがとうございます。
  今回対象となっているのは、以下のような駐輪場です。
  http://www.sagamiharashi-machimidori.or.jp/img/uploads/3/20071023093446_1.jpg
  比較的に少ないカメラによって、各場所に自転車が止まっているかを判別したいです。
  
  自転車が重なっているため、背景差分だけでは、判別しにくいかと考えております。
  撮影場所によりますが、各場所を区切って空間情報を抽出して、その空間にものがあるかを判別できるなら、比較的に判別しやすいかもしれません。
  素人の考えですみませんが、色々と教えて頂ければ、幸いです。
  
  読み込み中…
  
  返信
  - NegativeMind より:
    
    2017年2月25日 1:56 PM
    
    なるほど、自転車の有無を検出したいのですか。確かに背景差分は難しそうですね。
    この場合、画像認識で対処するより、安価な物理的なスイッチ、あるいは距離センサーを各スペースに設置した方が確実な気はします。(お金かかりますね…)
    
    リンクの画像を見てふと思ったのですが、駐輪場に止まるのが自転車限定であれば、車輪(楕円形状)を検出するのもアリかもしれません。
    利用者がルール通りに駐輪してくれると仮定すると、撮影画像上での車輪(楕円形状)の位置はおおよそ予想がつきますから、その位置にならぶ楕円の数を数えるとか。
    遮蔽の関係で上手く検出できるか保証できませんが、カメラの配置を工夫して自転車の後輪が必ず撮影できるように設置してみれば実験ぐらいはできるかも。
    
    すみません、ちょっとお役に立ててないかも・・・
    
    ちなみに、openMVGを使って3次元復元する場合でも、各自転車が重なって写ったままの画像からは正しく形状復元できません。
    
    読み込み中…
    
    返信

千里より:

2017年2月25日 12:19 PM

面白いブログ、ありがとうございます。
OpenMVGについての質問ですが、複数のカメラ画面から室内の立体空間を再現する上、特定の場所にものが置いているかを判別することが可能ですか？もし、可能なら、その場合、カメラの台数や、撮影角度について、要求がありますか？

読み込み中…

返信
- NegativeMind より:
  
  2017年2月25日 1:00 PM
  
  こんにちは。
  
  openMVGは画像から3次元形状を復元するためのライブラリですので、「特定の場所に物が置いてあるかを判別する」という目的での使用には適していません。
  要件を聞く限り、単純に2次元の背景差分で対処できる気がします。
  
  カメラを固定しておけば、「物が無い状態」と「物がある状態」で撮影画像の特定の領域の画素だけが変化しますので、その変化を検出すれば目的を果たせるのでは？
  
  OpenCVの背景差分機能や、BGSLibraryという背景差分用のライブラリを試してみてはいかがでしょうか？
  
  読み込み中…
  
  返信
  - 千里より:
    
    2017年2月25日 1:13 PM
    
    早速のご返事、大変ありがとうございます。
    今回対象となっているのは、以下のような駐輪場です。
    http://www.sagamiharashi-machimidori.or.jp/img/uploads/3/20071023093446_1.jpg
    比較的に少ないカメラによって、各場所に自転車が止まっているかを判別したいです。
    
    自転車が重なっているため、背景差分だけでは、判別しにくいかと考えております。
    撮影場所によりますが、各場所を区切って空間情報を抽出して、その空間にものがあるかを判別できるなら、比較的に判別しやすいかもしれません。
    素人の考えですみませんが、色々と教えて頂ければ、幸いです。
    
    読み込み中…
    
    返信
    - NegativeMind より:
      
      2017年2月25日 1:56 PM
      
      なるほど、自転車の有無を検出したいのですか。確かに背景差分は難しそうですね。
      この場合、画像認識で対処するより、安価な物理的なスイッチ、あるいは距離センサーを各スペースに設置した方が確実な気はします。(お金かかりますね…)
      
      リンクの画像を見てふと思ったのですが、駐輪場に止まるのが自転車限定であれば、車輪(楕円形状)を検出するのもアリかもしれません。
      利用者がルール通りに駐輪してくれると仮定すると、撮影画像上での車輪(楕円形状)の位置はおおよそ予想がつきますから、その位置にならぶ楕円の数を数えるとか。
      遮蔽の関係で上手く検出できるか保証できませんが、カメラの配置を工夫して自転車の後輪が必ず撮影できるように設置してみれば実験ぐらいはできるかも。
      
      すみません、ちょっとお役に立ててないかも・・・
      
      ちなみに、openMVGを使って3次元復元する場合でも、各自転車が重なって写ったままの画像からは正しく形状復元できません。
      
      読み込み中…
      
      返信

openMVG: “open Multiple View Geometry”

関連記事

Python拡張モジュールのWindows用インストーラー配布サイト

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

1枚の画像からマテリアルを作成できる無料ツール『Materialize』

ブラウザ操作自動化ツール『Selenium』を試す

pythonもかじってみようかと

MRenderUtil::raytrace

Raspberry Pi

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

書籍『OpenCV 3 プログラミングブック』を購入

SDカードサイズのコンピューター『Intel Edison』

Multi-View Environment：複数画像から3次元形状を再構築するライブラリ

第25回コンピュータビジョン勉強会＠関東に行って来た

まだ続くブログの不調

PythonでMayaのShapeノードプラグインを作る

RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』

顔追跡による擬似3D表示『Dynamic Perspective』

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

WordPressのテーマを自作する

iPhone・iPod touchで動作する知育ロボット『ROMO』

チャットツール用bot開発フレームワーク『Hubot』

Googleが画像解析旅行ガイドアプリのJetpac社を買収

html5のcanvasの可能性

OpenSfM：PythonのStructure from Motionライブラリ

プログラミングスキルとは何か？

マルコフ連鎖モンテカルロ法

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

OpenCV 3.1のsfmモジュールを試す

CNN Explainer：畳み込みニューラルネットワーク可視化ツール

Active Appearance Models（AAM）

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

TensorFlowでCGを微分できる『TensorFlow Graphics』

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

立体視を試してみた

ポイントクラウドコンソーシアム

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

adskShaderSDK

OpenCVでPhotoshopのプラグイン開発

PyDataTokyo主催のDeep Learning勉強会

Mean Stack開発の最初の一歩

Structure from Motion (多視点画像からの3次元形状復元)

Seleniumを使ったFXや株の自動取引

コメント

個人情報に関するお知らせ