.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

Structure from Motion (多視点画像からの3次元形状復元)

NegativeMind

11年前

3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なのよね。

Structure from Motion (多視点画像からの3次元形状復元)とは？

Structure from Motion(SfM)は、視点の違う複数枚の画像から被写体の3次元形状、及びカメラの相対位置を復元するというジャンル。理論上、5視点あればカメラ位置は推定できるらしい。最近では、ネット上の画像を使って大規模に街の形状を復元する研究とかもある。
CG分野から見れば、これはモデリングのプロセスで、広い意味では現実物体の3次元スキャン手法と言えるかも。
SSII2013のチュートリアルセッション「多視点画像からの3次元復元　～基本原理から大規模復元まで～」で知りました。

この手法の特性

この手法は複数画像間の対応を求めるために局所特徴量を使うので、被写体にはそれなりに模様とかパターンが分布していないと上手くいかない。当然、光沢のある被写体は対応が上手く取れないので形状が復元できない。よくある例だと、ぬいぐるみみたいにふさふさして光沢がないオブジェクトは上手くいく。
画像間の対応を求めるのはパノラマ画像の合成と似た感じ。文献によると、対応点を求めるには視差が15度以下であることが望ましいらしい。

手軽に試すなら

フリーのツールやオープンソースのライブラリもいくつかあり、Youtubeでもいっぱい例が見つかる。
こちらは有名なフリーツールのVisualSFM

参考資料

処理の中身を詳しく知りたいなら、↓こちらの書籍の第4章 Exploring Structure from Motion Using OpenCVが無料で公開されている。

ソースコードはGitHubにある。これをビルドするには、OpenCVとは別にPoint Cloud Library(PCL)とSimple Sparse Bundle Adjustment (SSBA)が必要。

参考記事：【新書情報】Mastering Opencv with Practical Computer Vision (洋書)　- 実践的なCompute Vision応用のOpenCVによる習得を目指す本

日本語で読める参考書籍

3次元復元系の日本語解説本ならこちら↓

コンピュータビジョン勉強会@関東の第28回はこの書籍の輪読会だった。

1.はじめに – 2.1 画像収集

2.2 カメラパラメータ推定 – 2.2.1 Structure-from-Motion

2.3 密な形状復元 – 2.3.1 最先端のMVS研究例

3. 多眼ステレオ – 3.1 二枚の画像からのphoto-consistency

3.1 複数枚の画像からのphoto-consistency – 3.2 デプスマップ復元

3.3 デプスマップからのメッシュ復元 – 4 むすび

その他参考記事：

画像から3次元形状を復元！OpenMVGでSfMを試してみた
 VisualSfMの使い方　その1 -最も単純な使い方-
VisualSfMの使い方　その2 -時系列画像からの復元-
VisualSfMの使い方　その3 -既知のカメラパラメータを用いた復元-
VisualSfMの使い方　その4 -対応点リストの読み込み-
VisualSfMの使い方　その5 -三次元点の追加-

2015/01/17追記：
上記とは別にOpenCVを使った実装例を見つけた。
Structure from Motion and 3D reconstruction on the easy in OpenCV 2.3+ [w/ code]
ソースコードはこちら↓
Toy Structure From Motion Library using OpenCV

KelpNet：C#で使える可読性重視のディープラーニングライブラリ

ZBrushでUndo Historyを動画に書き出す

ZBrushでアヴァン・ガメラを作ってみる脚のポーズ調整

Adobe Photoshop CS5の新機能

Transformers ”Reference & Bulid” Siggraph 2007

ニンテンドー3DSのGPU PICA200

iPhone欲しいなぁ

MLDemos：機械学習について理解するための可視化ツール

Runway ML：クリエイターのための機械学習ツール

3Dグラフィックスの入門書

ZBrushでアマビエを作るその2

無料で使える人体3DCG作成ツール

uvでWindows11のPython環境を管理する

CycleGAN：ドメイン関係を学習した画像変換

ZBrush 2018での作業環境を整える

ROMOハッカソンに行ってきた

ニューラルネットワークで画像分類

3DCG Meetup #4に行ってきた

Regard3D：オープンソースのStructure from Motionツール

PSPNet (Pyramid Scene Parsing Network)：ディープラーニングによ...

ZBrushでアヴァン・ガメラを作ってみるパーツ分割

Open Shading Language (OSL)

Kaolin：3Dディープラーニング用のPyTorchライブラリ

Windows10でPyTorchをインストールしてVSCodeで使う

『ローグ・ワン/スター・ウォーズ・ストーリー』"あのキャラクター"のメイキング

ジュラシック・パークのメイキング

イタリアの自動車ブランドFiatとゴジラがコラボしたCMのメイキング

iOSデバイスと接続して連携するガジェットの開発方法

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

Model View Controller

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

OpenCV 3.1から追加されたSfMモジュール

UnityのTransformクラスについて調べてみた

Texturing & Modeling A Procedural ApproachをGoo...

viser：Pythonで使える3D可視化ライブラリ

布地のシワの法則性

ゴジラ(2014)のディティール制作の舞台裏

書籍『The Art of Mystical Beasts』を購入

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

ZBrushでアヴァン・ガメラを作ってみる口内の微調整・身体のライン修正

MythTV：Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

WordPressのサーバ引っ越し方法を考える