OpenSfM:PythonのStructure from Motionライブラリ

スウェーデンのスタートアップMapillary社が公開しているOpenSfMというStructure from Motion用のライブラリがあるそうです。ライセンスは簡易BSDライセンス(Simplified BSD License)。2条項BSDライセンス(BSD 2-Clause license)とも呼ばれるやつで、著作権を表示すれば商用利用、修正、配布、サブライセンスOKだ。

OpenSfM

OpenSfM

OpenSfMは、OpenCVを用いてPythonで書かれたStructure from Motionライブラリです。このライブラリは、複数枚の画像からカメラの姿勢と3Dシーンを再構成するための処理パイプラインとして機能します。ロバストでスケーラブルな復元パイプラインの構築を重視したStructure from Motionの基本モジュール(特徴検出/マッチング、minimal solvers)で構成されています。
また、外部センサー(例えば、GPS、加速度センサー)の値を統合し、地理的な位置合わせや、よりロバストな結果を得ることができます。JavaScriptのビューアを設けており、モデルのプレビューや、パイプラインのデバッグに利用できます。

要はスマートフォンなどで撮影した複数枚の画像からGoogleストリートビューのようなものを作成するためのライブラリということのようです。画像だけでなくGPSや加速度センサーの情報も利用するあたり、とてもストリートビュー的な規模を意識している感じ。専用の撮影車両に依存しない、スマホユーザー達による民主的なストリートビュー作成ツールと言ったところ。
https://blog.mapillary.com/update/2014/12/15/sfm-preview.html



このライブラリは、クラウドソーシングでストリート映像を作成するプロジェクトのためのものですかね。↓
http://gigazine.net/news/20140903-mapillary/
https://jp.techcrunch.com/2018/09/15/2018-09-13-mapillary-rekognition-amazon/

このライブラリを使うには以下の依存ライブラリも必要となります。

依存ライブラリ

ソースコードはGitHubにある↓
https://github.com/mapillary/OpenSfM

OpenCVだけでなくOpenGVも使っているんですね。



QiitaではDocker上で動かす方法を書いている人がいる。
http://qiita.com/takahi/items/c0b21714a62935f67606

名称の”SfM”は”Structure from Motion”の略だと思うけど、カメラ位置の推定と撮影画像の補間までもStructure from Motionと呼ぶんですかね。てっきり3次元形状復元までの処理も含めてStructure from Motionだと思っていた。

このライブラリのリポジトリをGourceで可視化した動画を見つけた。2013年から始まってるのね。

https://www.youtube.com/watch?v=7YHvFVwUwcw

むちゃくちゃ巨大なライブラリというわけでもなさそうだな。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)

関連記事

HD画質の無駄遣い

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

OpenCVの三角測量関数『cv::triangulatepoints』

BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ

2D→3D復元技術で使われる用語まとめ

Blender 2.8がついに正式リリース!

OpenMVSのサンプルを動かしてみる

Faster R-CNN:ディープラーニングによる一般物体検出手法

VCG Library:C++のポリゴン操作ライブラリ

trimesh:PythonでポリゴンMeshを扱うライブラリ

DensePose:画像中の人物表面のUV座標を推定する

MPFB2:Blenderの人体モデリングアドオン

PGGAN:段階的に解像度を上げて学習を進めるGAN

OpenCVでPhotoshopのプラグイン開発

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

PyDataTokyo主催のDeep Learning勉強会

Theia:オープンソースのStructure from Motionライブラリ

iPhoneで3D写真が撮れるアプリ『seene』

viser:Pythonで使える3D可視化ライブラリ

Caffe:読みやすくて高速なディープラーニングのフレームワーク

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

フォトンの放射から格納までを可視化した動画

Multi-View Environment:複数画像から3次元形状を再構築するライブラリ

C++ 標準テンプレートライブラリ (STL)

OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...

顔画像処理技術の過去の研究

Qlone:スマホのカメラで3Dスキャンできるアプリ

Human Generator:Blenderの人体生成アドオン

Mechanizeで要認証Webサイトをスクレイピング

WordPressプラグインによるサイトマップの自動生成

Unity Scriptコーディング→Unreal Engine Scriptコーディング

OpenCV

タマムシっぽい質感

libigl:軽量なジオメトリ処理ライブラリ

FacebookがDeep learningツールの一部をオープンソース化

WebGL開発に関する情報が充実してきている

オープンソースの取引プラットフォーム

ブログが1日ダウンしてました

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

法線マップを用意してCanvas上でShadingするサンプル

動的なメモリの扱い

コメント