OpenCVで動画の手ぶれ補正

こちらのサイトに手振れ補正する理屈とOpenCVで書いたサンプルが載ってる。

Simple video stabilization using OpenCV

  1. オプティカルフローを用いて、前後フレーム間のトランスフォームを求める。
  2. トランスフォームは3つのパラメータ:dx, dy, da(角度)で構成され、基本的に剛体の剛性のユークリッド変換とし、スケーリングや共有は考慮しない。

  3. ブレの軌跡を得るために、各フレームのx, y, 角度のトランスフォームを保存する。
  4. 移動平均窓を使用して軌跡を滑らかにする。
  5. ユーザが平滑化に使用するフレーム数となる半径を指定する。

  6. 以下のように新しいトランスフォームを求める。
  7. 新しいトランスフォーム = 元のトランスフォーム + (平滑化した軌跡 – 元の軌跡)

  8. 動画に新しいトランスフォームを適用する。

サンプルコードもある。



補正結果比較動画。



2020年10月 追記:このC++実装をもとに有志がPythonで実装したPython Video StabilizationがGitHubで公開されている↓
https://github.com/AdamSpannbauer/python_video_stab

2019年1月 追記:Learn OpenCVでも手振れ補正のチュートリアルが公開されたぞ↓
https://www.learnopencv.com/video-stabilization-using-point-feature-matching-in-opencv/


関連記事

手を動かしながら学ぶデータマイニング

なんかすごいサイト

CGALDotNet:計算幾何学ライブラリ CGALのC#ラ...

Google Colaboratoryで遊ぶ準備

Caffe:読みやすくて高速なディープラーニングのフレームワ...

書籍『OpenCV 3 プログラミングブック』を購入

MFnMeshクラスのsplit関数

写真に3Dオブジェクトを違和感無く合成する『3DPhotoM...

OpenCV 3.1のsfmモジュールのビルド再び

Kornia:微分可能なコンピュータービジョンライブラリ

Dlib:C++の機械学習ライブラリ

R-CNN (Regions with CNN featur...

プログラミングスキルとは何か?

RSSフィードを読込んで表示するWordpressプラグイン...

3Dスキャンに基づくプロシージャルフェイシャルアニメーション

フォトンの放射から格納までを可視化した動画

TensorSpace.js:ニューラルネットワークの構造を...

FCN (Fully Convolutional Netwo...

UnityのGameObjectの向きをScriptで制御す...

科学技術計算向けスクリプト言語『Julia』

PyTorch3D:3Dコンピュータービジョンライブラリ

Unityの薄い本

顔追跡による擬似3D表示『Dynamic Perspecti...

Googleが画像解析旅行ガイドアプリのJetpac社を買収

ROSでガンダムを動かす

trimesh:PythonでポリゴンMeshを扱うライブラ...

プログラムによる景観の自動生成

UnityでTweenアニメーションを実装できる3種類の無料...

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...

OpenCVの超解像(SuperResolution)モジュ...

Netron:機械学習モデルを可視化するツール

参考書

Super Resolution:OpenCVの超解像処理モ...

Paul Debevec

Point Cloud Consortiumのセミナー「3D...

オープンソースのIT資産・ライセンス管理システム『Snipe...

Raspberry Pi 2を買いました

MVStudio:オープンソースのPhotogrammetr...

iPhoneで3D写真が撮れるアプリ『seene』

NeRF (Neural Radiance Fields):...

ニューラルネットワークと深層学習

Raspberry Piでセンサーの常時稼働を検討する

コメント