OpenCVで動画の手ぶれ補正

こちらのサイトに手振れ補正する理屈とOpenCVで書いたサンプルが載ってる。

Simple video stabilization using OpenCV

  1. オプティカルフローを用いて、前後フレーム間のトランスフォームを求める。
  2. トランスフォームは3つのパラメータ:dx, dy,da(角度)で構成され、基本的に剛体の剛性のユークリッド変換とし、スケーリングや共有は考慮しない。

  3. ブレの軌跡を得るために、各フレームのx, y, 角度のトランスフォームを保存する。
  4. 移動平均窓を使用して軌跡を滑らかにする。
  5. ユーザが平滑化に使用するフレーム数となる半径を指定する。

  6. 以下のように新しいトランスフォームを求める。
  7. 新しいトランスフォーム = 元のトランスフォーム + (平滑化した軌跡 – 元の軌跡)


    スポンサーリンク
  8. 動画に新しいトランスフォームを適用する。

サンプルコードもある。


スポンサーリンク


補正結果比較動画。



2020年10月 追記:このC++実装をもとに有志がPythonで実装したPython Video StabilizationがGitHubで公開されている↓
https://github.com/AdamSpannbauer/python_video_stab

2019年1月 追記:Learn OpenCVでも手振れ補正のチュートリアルが公開されたぞ↓
https://www.learnopencv.com/video-stabilization-using-point-feature-matching-in-opencv/



スポンサーリンク

関連記事

オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う
Python.NET:Pythonと.NETを連携させるパッケージ
UnityプロジェクトをGitHubで管理する
ディープラーニング
GAN (Generative Adversarial Networks):敵対的生成ネットワーク
2D→3D復元技術で使われる用語まとめ
Google App Engine上のWordPressでAmazonJSを利用する
AMIMOTO(PVM版)で作成したインスタンスをAMIMOTO (HVM版)へ移行する
RefineNet (Multi-Path Refinement Network):ディープラーニン...
複数画像から3次元形状を再構築するライブラリ『Multi-View Environment』
第25回コンピュータビジョン勉強会@関東に行って来た
定数
OpenCV 3.1から追加されたSfMモジュール
フォトンの放射から格納までを可視化した動画
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
UnityでARKit2.0
SONYの自律型エンタテインメントロボット『aibo』
Manim:Pythonで使える数学アニメーションライブラリ
Iterator
ブログをGoogle App EngineからAmazon EC2へ移行
Leap MotionでMaya上のオブジェクトを操作できるプラグイン
Unity ARKitプラグインサンプルのドキュメントを読む
Twitter APIのPythonラッパー『python-twitter』
OpenMayaのPhongShaderクラス
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
3D復元技術の情報リンク集
ZBrushのZScript入門
コンピュータビジョンの技術マップ
SDカードサイズのコンピューター『Intel Edison』
KelpNet:C#で使える可読性重視のディープラーニングライブラリ
Structure from Motion (多視点画像からの3次元形状復元)
OpenCV
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
clearcoat Shader
人体モデリングできるBlenderアドオン『ManuelBastioniLAB』
Fast R-CNN:ディープラーニングによる一般物体検出手法
オープンソースの取引プラットフォーム
OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク
ニューラルネットワークで画像分類
Russian3DScannerのトポロジー転送ツール『WrapX』
OpenCVの顔検出過程を可視化した動画
立体視を試してみた

コメント