OpenCVで動画の手ぶれ補正

こちらのサイトに手振れ補正する理屈とOpenCVで書いたサンプルが載ってる。

Simple video stabilization using OpenCV

  1. オプティカルフローを用いて、前後フレーム間のトランスフォームを求める。
  2. トランスフォームは3つのパラメータ:dx, dy, da(角度)で構成され、基本的に剛体の剛性のユークリッド変換とし、スケーリングや共有は考慮しない。

  3. ブレの軌跡を得るために、各フレームのx, y, 角度のトランスフォームを保存する。
  4. 移動平均窓を使用して軌跡を滑らかにする。
  5. ユーザが平滑化に使用するフレーム数となる半径を指定する。

  6. 以下のように新しいトランスフォームを求める。
  7. 新しいトランスフォーム = 元のトランスフォーム + (平滑化した軌跡 – 元の軌跡)

  8. 動画に新しいトランスフォームを適用する。

サンプルコードもある。



補正結果比較動画。



2020年10月 追記:このC++実装をもとに有志がPythonで実装したPython Video StabilizationがGitHubで公開されている↓
https://github.com/AdamSpannbauer/python_video_stab

2019年1月 追記:Learn OpenCVでも手振れ補正のチュートリアルが公開されたぞ↓
https://www.learnopencv.com/video-stabilization-using-point-feature-matching-in-opencv/


関連記事

Unityの各コンポーネント間でのやり取り

Google App Engineのデプロイ失敗

ニューラルネットワークと深層学習

Unreal Engineの薄い本

ZBrushのZScript入門

MFnMeshクラスのsplit関数

PeopleSansPeople:機械学習用の人物データをU...

Unityで学ぶC#

Twitter APIのPythonラッパー『python-...

Point Cloud Utils:Pythonで3D点群・...

ブラウザ操作自動化ツール『Selenium』を試す

クラスの基本

PyMC:Pythonのベイズ統計ライブラリ

まだ続くブログの不調

SegNet:ディープラーニングによるSemantic Se...

Blender 2.8がついに正式リリース!

MLDemos:機械学習について理解するための可視化ツール

FreeMoCap Project:オープンソースのマーカー...

Pythonの自然言語処理ライブラリ『NLTK(Natura...

オープンソースの物理ベースGIレンダラ『appleseed』

ManimML:機械学習の概念を視覚的に説明するためのライブ...

DUSt3R:3Dコンピュータービジョンの基盤モデル

iPhoneで3D写真が撮れるアプリ『seene』

2D→3D復元技術で使われる用語まとめ

オープンソースのIT資産・ライセンス管理システム『Snipe...

MPFB2:Blenderの人体モデリングアドオン

Boost オープンソースライブラリ

TeleSculptor:空撮動画からPhotogramme...

3D Gaussian Splatting:リアルタイム描画...

BlenderProc:Blenderで機械学習用の画像デー...

Web経由でRaspberry PiのGPIOを操作したい

オープンソースの物理ベースレンダラ『Mitsuba』をMay...

iPadをハンディ3Dスキャナにするガジェット『iSense...

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Python for Unity:UnityEditorでP...

iOSデバイスのためのフィジカル・コンピューティングツールキ...

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

プログラミングスキルとは何か?

OpenCV 3.1とopencv_contribモジュール...

ブログをGoogle App EngineからAmazon ...

書籍『ゼロから作るDeep Learning』で自分なりに学...

オープンソースの取引プラットフォーム

コメント