OpenSfM:PythonのStructure from Motionライブラリ

スウェーデンのスタートアップMapillary社が公開しているOpenSfMというStructure from Motion用のライブラリがあるそうです。ライセンスは簡易BSDライセンス(Simplified BSD License)。2条項BSDライセンス(BSD 2-Clause license)とも呼ばれるやつで、著作権を表示すれば商用利用、修正、配布、サブライセンスOKだ。

OpenSfM

OpenSfM

OpenSfMは、OpenCVを用いてPythonで書かれたStructure from Motionライブラリです。このライブラリは、複数枚の画像からカメラの姿勢と3Dシーンを再構成するための処理パイプラインとして機能します。ロバストでスケーラブルな復元パイプラインの構築を重視したStructure from Motionの基本モジュール(特徴検出/マッチング、minimal solvers)で構成されています。
また、外部センサー(例えば、GPS、加速度センサー)の値を統合し、地理的な位置合わせや、よりロバストな結果を得ることができます。JavaScriptのビューアを設けており、モデルのプレビューや、パイプラインのデバッグに利用できます。

要はスマートフォンなどで撮影した複数枚の画像からGoogleストリートビューのようなものを作成するためのライブラリということのようです。画像だけでなくGPSや加速度センサーの情報も利用するあたり、とてもストリートビュー的な規模を意識している感じ。専用の撮影車両に依存しない、スマホユーザー達による民主的なストリートビュー作成ツールと言ったところ。
https://blog.mapillary.com/update/2014/12/15/sfm-preview.html


スポンサーリンク


このライブラリは、クラウドソーシングでストリート映像を作成するプロジェクトのためのものですかね。↓
http://gigazine.net/news/20140903-mapillary/
https://jp.techcrunch.com/2018/09/15/2018-09-13-mapillary-rekognition-amazon/

このライブラリを使うには以下の依存ライブラリも必要となります。


スポンサーリンク

依存ライブラリ

ソースコードはGitHubにある↓
https://github.com/mapillary/OpenSfM

OpenCVだけでなくOpenGVも使っているんですね。



QiitaではDocker上で動かす方法を書いている人がいる。
http://qiita.com/takahi/items/c0b21714a62935f67606

名称の”SfM”は”Structure from Motion”の略だと思うけど、カメラ位置の推定と撮影画像の補間までもStructure from Motionと呼ぶんですかね。てっきり3次元形状復元までの処理も含めてStructure from Motionだと思っていた。

このライブラリのリポジトリをGourceで可視化した動画を見つけた。2013年から始まってるのね。

https://www.youtube.com/watch?v=7YHvFVwUwcw

むちゃくちゃ巨大なライブラリというわけでもなさそうだな。

コンピュータビジョン最先端ガイド5 (CVIMチュートリアルシリーズ)


スポンサーリンク

関連記事

3Dグラフィックスの入門書
Cartographer:オープンソースのSLAMライブラリ
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
TorchStudio:PyTorchのための統合開発環境とエコシステム
Unity Scriptコーディング→Unreal Engine Scriptコーディング
顔追跡による擬似3D表示『Dynamic Perspective』
NeRF (Neural Radiance Fields):深層学習による新規視点合成
畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...
Blendify:コンピュータービジョン向けBlenderラッパー
Facebookの顔認証技術『DeepFace』
WordPressのテーマを自作する
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
画像生成AI Stable Diffusionで遊ぶ
ベイズ推定とグラフィカルモデル
ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
AfterEffectsプラグイン開発
Deep Fluids:流体シミュレーションをディープラーニングで近似する
ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る
統計的な顔モデル
C++ 標準テンプレートライブラリ (STL)
YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法
WordPressのサーバ引っ越し方法を考える
写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』
ManuelBastioniLAB:人体モデリングできるBlenderアドオン
Dlib:C++の機械学習ライブラリ
OpenCV 3.1のsfmモジュールのビルド再び
Unity ARKitプラグインサンプルのドキュメントを読む
Google App EngineでWordPress
Math Inspector:科学計算向けビジュアルプログラミングツール
OpenCVで動画の手ぶれ補正
ROSの薄い本
OpenCVの顔検出過程を可視化した動画
Structure from Motion (多視点画像からの3次元形状復元)
ニューラルネットワークで画像分類
1枚の画像からマテリアルを作成できる無料ツール『Materialize』
OpenCVでPhotoshopのプラグイン開発
クラスの基本
ブログの復旧が難航してた話
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
このブログのデザインに飽きてきた
Accord.NET Framework:C#で使える機械学習ライブラリ
KelpNet:C#で使える可読性重視のディープラーニングライブラリ

コメント