サイトアイコン NegativeMindException

OpenSfM:PythonのStructure from Motionライブラリ

スウェーデンのスタートアップMapillary社が公開しているOpenSfMというStructure from Motion用のライブラリがあるそうです。ライセンスは簡易BSDライセンス(Simplified BSD License)。2条項BSDライセンス(BSD 2-Clause license)とも呼ばれるやつで、著作権を表示すれば商用利用、修正、配布、サブライセンスOKだ。

OpenSfM



OpenSfMは、OpenCVを用いてPythonで書かれたStructure from Motionライブラリです。このライブラリは、複数枚の画像からカメラの姿勢と3Dシーンを再構成するための処理パイプラインとして機能します。ロバストでスケーラブルな復元パイプラインの構築を重視したStructure from Motionの基本モジュール(特徴検出/マッチング、minimal solvers)で構成されています。
また、外部センサー(例えば、GPS、加速度センサー)の値を統合し、地理的な位置合わせや、よりロバストな結果を得ることができます。JavaScriptのビューアを設けており、モデルのプレビューや、パイプラインのデバッグに利用できます。

要はスマートフォンなどで撮影した複数枚の画像からGoogleストリートビューのようなものを作成するためのライブラリということのようです。画像だけでなくGPSや加速度センサーの情報も利用するあたり、とてもストリートビュー的な規模を意識している感じ。専用の撮影車両に依存しない、スマホユーザー達による民主的なストリートビュー作成ツールと言ったところ。
https://blog.mapillary.com/update/2014/12/15/sfm-preview.html



このライブラリは、クラウドソーシングでストリート映像を作成するプロジェクトのためのものですかね。↓
http://gigazine.net/news/20140903-mapillary/
https://jp.techcrunch.com/2018/09/15/2018-09-13-mapillary-rekognition-amazon/

このライブラリを使うには以下の依存ライブラリも必要となります。


スポンサーリンク

依存ライブラリ

ソースコードはGitHubにある↓
https://github.com/mapillary/OpenSfM

OpenCVだけでなくOpenGVも使っているんですね。



QiitaではDocker上で動かす方法を書いている人がいる。
http://qiita.com/takahi/items/c0b21714a62935f67606

名称の”SfM”は”Structure from Motion”の略だと思うけど、カメラ位置の推定と撮影画像の補間までもStructure from Motionと呼ぶんですかね。てっきり3次元形状復元までの処理も含めてStructure from Motionだと思っていた。

このライブラリのリポジトリをGourceで可視化した動画を見つけた。2013年から始まってるのね。



むちゃくちゃ巨大なライブラリというわけでもなさそうだな。



スポンサーリンク

関連記事

  • 科学技術計算向けスクリプト言語『Julia』
  • Accord.NET Framework:C#で使える機械学習ライブラリ
  • オープンソースの物理ベースGIレンダラ『appleseed』
  • Unityで学ぶC#
  • DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
  • cvui:OpenCVのための軽量GUIライブラリ
  • iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
  • 第25回コンピュータビジョン勉強会@関東に行って来た
  • 3Dグラフィックスの入門書
  • 写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』
  • Python for Unity:UnityEditorでPythonを使えるパッケージ
  • Open3D:3Dデータ処理ライブラリ
  • 3Dモデルを立体視で確認できるVRアプリを作っている
  • OpenCLに対応したオープンソースの物理ベースレンダラ『LuxRender(ルクスレンダー)』
  • Kornia:微分可能なコンピュータービジョンライブラリ
  • Mitsuba 3:オープンソースの研究向けレンダラ
  • trimesh:PythonでポリゴンMeshを扱うライブラリ
  • CycleGAN:ドメイン関係を学習した画像変換
  • 頭蓋骨からの顔復元と進化過程の可視化
  • SONY製のニューラルネットワークライブラリ『NNabla』
  • pythonもかじってみようかと
  • MVStudio:オープンソースのPhotogrammetryツール
  • Raspberry Pi 2のGPIOピン配置
  • Iterator
  • Mayaのプラグイン開発
  • Kaolin:3Dディープラーニング用のPyTorchライブラリ
  • ブログの復旧が難航してた話
  • iOSで使えるJetpac社の物体認識SDK『DeepBelief』
  • Faster R-CNN:ディープラーニングによる一般物体検出手法
  • Unityの各コンポーネント間でのやり取り
  • Unityで強化学習できる『Unity ML-Agents』
  • iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』
  • OpenGVのライブラリ構成
  • まだ続くブログの不調
  • Deep Learningとその他の機械学習手法の性能比較
  • Russian3DScannerのトポロジー転送ツール『WrapX』
  • html5のcanvasの可能性
  • Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
  • SSII2014 チュートリアル講演会の資料
  • Google App Engineのデプロイ失敗
  • 顔画像処理技術の過去の研究
  • CNN Explainer:畳み込みニューラルネットワーク可視化ツール
  • モバイルバージョンを終了