OpenCVで動画の手ぶれ補正

こちらのサイトに手振れ補正する理屈とOpenCVで書いたサンプルが載ってる。

Simple video stabilization using OpenCV

  1. オプティカルフローを用いて、前後フレーム間のトランスフォームを求める。
  2. トランスフォームは3つのパラメータ:dx, dy, da(角度)で構成され、基本的に剛体の剛性のユークリッド変換とし、スケーリングや共有は考慮しない。

  3. ブレの軌跡を得るために、各フレームのx, y, 角度のトランスフォームを保存する。
  4. 移動平均窓を使用して軌跡を滑らかにする。
  5. ユーザが平滑化に使用するフレーム数となる半径を指定する。

  6. 以下のように新しいトランスフォームを求める。
  7. 新しいトランスフォーム = 元のトランスフォーム + (平滑化した軌跡 – 元の軌跡)

  8. 動画に新しいトランスフォームを適用する。

サンプルコードもある。



補正結果比較動画。



2020年10月 追記:このC++実装をもとに有志がPythonで実装したPython Video StabilizationがGitHubで公開されている↓
https://github.com/AdamSpannbauer/python_video_stab

2019年1月 追記:Learn OpenCVでも手振れ補正のチュートリアルが公開されたぞ↓
https://www.learnopencv.com/video-stabilization-using-point-feature-matching-in-opencv/


関連記事

Google Colaboratoryで遊ぶ準備

3Dグラフィックスの入門書

なんかすごいサイト

ROSの薄い本

Unreal Engineの薄い本

ブラウザ操作自動化ツール『Selenium』を試す

Geogram:C++の3D幾何アルゴリズムライブラリ

Raspberry PiのGPIOを操作するPythonライ...

Runway ML:クリエイターのための機械学習ツール

顔画像処理技術の過去の研究

COLMAP:オープンソースのSfM・MVSツール

オープンソースの物理ベースGIレンダラ『appleseed』

Active Appearance Models(AAM)

U-Net:ディープラーニングによるSemantic Seg...

TensorSpace.js:ニューラルネットワークの構造を...

PCA (主成分分析)

書籍『仕事ではじめる機械学習』を読みました

Regard3D:オープンソースのStructure fro...

DCGAN (Deep Convolutional GAN)...

機械学習で遊ぶ

WordPress on Google App Engine...

FCN (Fully Convolutional Netwo...

UnityのTransformクラスについて調べてみた

NumSharp:C#で使えるNumPyライクな数値計算ライ...

Google XML Sitemap Generatorプラ...

オープンソースのIT資産・ライセンス管理システム『Snipe...

為替レートの読み方 2WAYプライス表示

Mask R-CNN:ディープラーニングによる一般物体検出・...

openMVG:複数視点画像から3次元形状を復元するライブラ...

Facebookの顔認証技術『DeepFace』

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル ク...

手を動かしながら学ぶデータマイニング

MRenderUtil::raytrace

Cartographer:オープンソースのSLAMライブラリ

AndroidもopenGLも初心者さ (でもJavaは知っ...

SegNet:ディープラーニングによるSemantic Se...

BlenderのPython環境にPyTorchをインストー...

adskShaderSDK

Russian3DScannerのトポロジー転送ツール『Wr...

html5のcanvasの可能性

Unity ARKitプラグインサンプルのチュートリアルを読...

Super Resolution:OpenCVの超解像処理モ...

コメント