OpenSfM:PythonのStructure from Motionライブラリ

スウェーデンのスタートアップMapillary社が公開しているOpenSfMというStructure from Motion用のライブラリがあるそうです。ライセンスは簡易BSDライセンス(Simplified BSD License)。2条項BSDライセンス(BSD 2-Clause license)とも呼ばれるやつで、著作権を表示すれば商用利用、修正、配布、サブライセンスOKだ。

OpenSfM

OpenSfMは、OpenCVを用いてPythonで書かれたStructure from Motionライブラリです。このライブラリは、複数枚の画像からカメラの姿勢と3Dシーンを再構成するための処理パイプラインとして機能します。ロバストでスケーラブルな復元パイプラインの構築を重視したStructure from Motionの基本モジュール(特徴検出/マッチング、minimal solvers)で構成されています。
また、外部センサー(例えば、GPS、加速度センサー)の値を統合し、地理的な位置合わせや、よりロバストな結果を得ることができます。JavaScriptのビューアを設けており、モデルのプレビューや、パイプラインのデバッグに利用できます。

要はスマートフォンなどで撮影した複数枚の画像からGoogleストリートビューのようなものを作成するためのライブラリということのようです。画像だけでなくGPSや加速度センサーの情報も利用するあたり、とてもストリートビュー的な規模を意識している感じ。専用の撮影車両に依存しない、スマホユーザー達による民主的なストリートビュー作成ツールと言ったところ。
https://blog.mapillary.com/update/2014/12/15/sfm-preview.html


スポンサーリンク


このライブラリは、クラウドソーシングでストリート映像を作成するプロジェクトのためのものですかね。↓
http://gigazine.net/news/20140903-mapillary/
https://jp.techcrunch.com/2018/09/15/2018-09-13-mapillary-rekognition-amazon/

このライブラリを使うには以下の依存ライブラリも必要となります。


スポンサーリンク

依存ライブラリ

OpenCVだけでなくOpenGVも使っているんですね。



QiitaではDocker上で動かす方法を書いている人がいる。
http://qiita.com/takahi/items/c0b21714a62935f67606

名称の”SfM”は”Structure from Motion”の略だと思うけど、カメラ位置の推定と撮影画像の補間までもStructure from Motionと呼ぶんですかね。てっきり3次元形状復元までの処理も含めてStructure from Motionだと思っていた。

このライブラリのリポジトリをGourceで可視化した動画を見つけた。2013年から始まってるのね。



むちゃくちゃ巨大なライブラリというわけでもなさそうだな。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)


スポンサーリンク

関連記事

PyTorch3D:3Dコンピュータービジョンライブラリ
書籍『イラストで学ぶ ディープラーニング』
Open3D:3Dデータ処理ライブラリ
Unityの薄い本
機械学習手法『Random Forest』
書籍『仕事ではじめる機械学習』を読みました
Googleが画像解析旅行ガイドアプリのJetpac社を買収
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
MPFB2:Blenderの人体モデリングアドオン
インタラクティブにComputer Visionコーディングができるツール『Live CV』
オープンソースの物理ベースGIレンダラ『appleseed』
iPhone・iPod touchで動作する知育ロボット『ROMO』
iOSデバイスと接続して連携するガジェットの開発方法
Webスクレイピングの勉強会に行ってきた
海外ドラマのChromaKey
ManuelBastioniLAB:人体モデリングできるBlenderアドオン
頭蓋骨からの顔復元と進化過程の可視化
Math Inspector:科学計算向けビジュアルプログラミングツール
UnityのTransformクラスについて調べてみた
libigl:軽量なジオメトリ処理ライブラリ
OpenCVの超解像(SuperResolution)モジュールを試す
cvui:OpenCVのための軽量GUIライブラリ
第25回コンピュータビジョン勉強会@関東に行って来た
SegNet:ディープラーニングによるSemantic Segmentation手法
ブログが1日ダウンしてました
Unreal Engineの薄い本
コンピュータビジョンの技術マップ
続・ディープラーニングの資料
Fast R-CNN:ディープラーニングによる一般物体検出手法
このブログのデザインに飽きてきた
HerokuでMEAN stack
株式会社ヘキサドライブの研究室ページ
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
ブログをGoogle App EngineからAmazon EC2へ移行
AfterEffectsプラグイン開発
OpenAR:OpenCVベースのマーカーARライブラリ
iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
Webサイトのワイヤーフレームが作成できるオンラインツール
Iterator
Russian3DScannerのトポロジー転送ツール『WrapX』
WordPressの表示を高速化する
UnityでARKit2.0

コメント