スウェーデンのスタートアップMapillary社が公開しているOpenSfMというStructure from Motion用のライブラリがあるそうです。ライセンスは簡易BSDライセンス(Simplified BSD License)。2条項BSDライセンス(BSD 2-Clause license)とも呼ばれるやつで、著作権を表示すれば商用利用、修正、配布、サブライセンスOKだ。
OpenSfM
OpenSfMは、OpenCVを用いてPythonで書かれたStructure from Motionライブラリです。このライブラリは、複数枚の画像からカメラの姿勢と3Dシーンを再構成するための処理パイプラインとして機能します。ロバストでスケーラブルな復元パイプラインの構築を重視したStructure from Motionの基本モジュール(特徴検出/マッチング、minimal solvers)で構成されています。
また、外部センサー(例えば、GPS、加速度センサー)の値を統合し、地理的な位置合わせや、よりロバストな結果を得ることができます。JavaScriptのビューアを設けており、モデルのプレビューや、パイプラインのデバッグに利用できます。
要はスマートフォンなどで撮影した複数枚の画像からGoogleストリートビューのようなものを作成するためのライブラリということのようです。画像だけでなくGPSや加速度センサーの情報も利用するあたり、とてもストリートビュー的な規模を意識している感じ。専用の撮影車両に依存しない、スマホユーザー達による民主的なストリートビュー作成ツールと言ったところ。
https://blog.mapillary.com/update/2014/12/15/sfm-preview.html
このライブラリは、クラウドソーシングでストリート映像を作成するプロジェクトのためのものですかね。↓
http://gigazine.net/news/20140903-mapillary/
https://jp.techcrunch.com/2018/09/15/2018-09-13-mapillary-rekognition-amazon/
このライブラリを使うには以下の依存ライブラリも必要となります。
依存ライブラリ
- OpenCV
- OpenGV
- Ceres Solver
- Boost Python
- NumPy, SciPy, Networkx, PyYAML, exifread
ソースコードはGitHubにある↓
https://github.com/mapillary/OpenSfM
OpenCVだけでなくOpenGVも使っているんですね。

QiitaではDocker上で動かす方法を書いている人がいる。
http://qiita.com/takahi/items/c0b21714a62935f67606
名称の”SfM”は”Structure from Motion”の略だと思うけど、カメラ位置の推定と撮影画像の補間までもStructure from Motionと呼ぶんですかね。てっきり3次元形状復元までの処理も含めてStructure from Motionだと思っていた。
このライブラリのリポジトリをGourceで可視化した動画を見つけた。2013年から始まってるのね。
https://www.youtube.com/watch?v=7YHvFVwUwcw
むちゃくちゃ巨大なライブラリというわけでもなさそうだな。

関連記事
Deep Fluids:流体シミュレーションをディープラーニ...
PyDataTokyo主催のDeep Learning勉強会
iPhoneアプリ開発 Xcode 5のお作法
動的なメモリの扱い
geometry3Sharp:Unity C#で使えるポリゴ...
ROSの薄い本
WordPress on Google App Engine...
AR (Augmented Reality)とDR (Dim...
ZBrushで作った3Dモデルを立体視で確認できるVRアプリ...
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
Google Chromecast
WordPressのサーバ引っ越し方法を考える
RSSフィードを読込んで表示するWordpressプラグイン...
PythonでMayaのShapeノードプラグインを作る
WordPressのテーマを自作する
COLMAP:オープンソースのSfM・MVSツール
Open Shading Language (OSL)
Dlib:C++の機械学習ライブラリ
BlenderProc:Blenderで機械学習用の画像デー...
iOSデバイスのためのフィジカル・コンピューティングツールキ...
畳み込みニューラルネットワーク (CNN: Convolut...
Raspberry Pi 2のGPIOピン配置
Unityからkonashiをコントロールする
Fast R-CNN:ディープラーニングによる一般物体検出手...
MeshroomでPhotogrammetry
Point Cloud Libraryに動画フォーマットが追...
Cartographer:オープンソースのSLAMライブラリ
Point Cloud Consortiumのセミナー「3D...
Unityの薄い本
KelpNet:C#で使える可読性重視のディープラーニングラ...
Google App Engine上のWordPressでA...
Structure from Motion (多視点画像から...
MB-Lab:Blenderの人体モデリングアドオン
ROSでガンダムを動かす
Verilog HDL
このブログのデザインに飽きてきた
ZScript
Pylearn2:ディープラーニングに対応したPythonの...
bpy-renderer:レンダリング用Pythonパッケー...
今年もSSII
OpenCVで顔のランドマークを検出する『Facemark ...
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト



コメント