OpenCVのバージョン3が正式リリースされたぞ

6月4日付でついにOpenCV 3.0の正式版がリリースされた。

さっそくOpenCV公式ページからインストーラーをダウンロードしたら、ページ上で以下の動画が再生された。

Google Summer Of Code 2014 contributions for OpenCV



これはGoogle Summer Of Code(GSoC) 2014の成果をまとめたムービーで、そのうちOpenCVに取り込まれるかもしれない機能らしい。GSoC自体はOpenCVだけじゃなくて、PCLなど、他のOSS向けプロジェクトもあるみたい。



この動画の中で個人的に気になっている機能が2つある。1つは、被写体の色成分と反射成分を分離するIntrinsic Image Decompositionという機能。そしてもう1つは、DTAM(Dense Tracking and Mapping)という技術を実装した機能。

DTAMとは?

DTAMは単眼カメラでリアルタイムに3次元空間をトラッキングする技術。良く知らなかったんだけど、登場したのは結構前で、2011年にICCVで発表されたものらしい。
まだ粗い理解だから大ざっぱに言うと、同じく単眼カメラによるリアルタイム3次元トラッキング技術として有名なPTAM(Parallel Tracking and Mapping)との大きな違いは、PTAMが疎な特徴点をベースに再構成を行うのに対して、DTAMでは画素単位で密に再構成を行うという点。(まあ、”Dense”という名前の通りですね)



調べてたらこんな資料を見つけたのでのんびり読もうと思う。↓



OpenCV 3.0自体は、全体の名前空間が整理されて、C++インターフェイスへの統一が図られてるっぽいので、構成がだいぶモダンになった印象。
dandelionさんがOpenCV 3.0のサマリーを何となく日本語訳したものを公開している。

GSoC 2013,2014プロジェクトの成果がOpenCV 3.0やopencv_contribに取り込まれました.

  • text detection
  • many computational photography algorithms (HDR, inpainting, edge-aware filters, superpixels, …)
  • tracking and optical flow algorithms
  • new features, including line descriptors, KAZE/AKAZE
  • general use optimization (hill climbing, linear programming)
  • greatly improved Python support, including Python 3.0 support, many new tutorials & samples on how to use OpenCV with Python.
  • 2d shape matching module and 3d surface matching module
  • RGB-D module
  • VTK-based 3D visualization module

2015/07/28 追記:
dandelionさんがBuild Insiderの記事をOpenCV 3.0対応版に改訂したみたい。

OpenCVとは? 最新3.0の新機能概要とモジュール構成

OpenCV 3.0ではOpenCV 2.4.xにあったモジュールのうち、一部のモジュールが、機能ごとに細分化されています。そのため、OpenCV 2.4.xのコードを3.0でも流用する場合は注意が必要です。

モジュール名(2.4.x) モジュール名(3.0) 細分化の概要
highgui highgui GUI(ウィンドウ表示) 左記のように、機能ごとにモジュールが細分化
imgcodecs 画像ファイル入出力
videoio 動画ファイルの入出力、カメラキャプチャ
gpu cudaarithm 機能ごとにモジュールが細分化
各機能の説明は割愛)
cudabgsegm
cudacodec
cudafeatures2d
cudafilters
cudaimgproc
cudalegacy
cudaobjdetect
cudaoptflow
cudastereo
cudawarping
cudev

この辺は気を付けよう。

2015/09/15追記:
OpenCV3.0に対応した日本語の書籍が出るようです。↓


OpenCV 3 プログラミングブック

2015/10/03追記:
購入した↓
https://blog.negativemind.com/2015/10/03/opencv-3-programing-book/

関連記事

Unityの各コンポーネント間でのやり取り

Iridescence:プロトタイピング向け軽量3D可視化ライブラリ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

ブログのデザイン変えました

BlenderのPython環境にPyTorchをインストールする

PGGAN:段階的に解像度を上げて学習を進めるGAN

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

Blender 2.8がついに正式リリース!

Pylearn2:ディープラーニングに対応したPythonの機械学習ライブラリ

SSD (Single Shot Multibox Detector):ディープラーニングによる一般...

Netron:機械学習モデルを可視化するツール

科学技術計算向けスクリプト言語『Julia』

インターフェイスは世界を規定する

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

Mitsuba 3:オープンソースの研究向けレンダラ

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

ベイズ推定とグラフィカルモデル

自前のShaderがおかしい件

顔追跡による擬似3D表示『Dynamic Perspective』

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

Active Appearance Models(AAM)

ニューラルネットワークで画像分類

UnityでPoint Cloudを表示する方法

ブログをGoogle App EngineからAmazon EC2へ移行

Qlone:スマホのカメラで3Dスキャンできるアプリ

PyMC:Pythonのベイズ統計ライブラリ

Pix2Pix:CGANによる画像変換

Profilograph

クライマックスヒーローズ

ミニ四駆を赤外線制御したりUnityと連携したり

プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)

Yahoo!で「トランスフォーマー!」を検索すると

円谷プロダクション クリエイティブアワード 金城哲夫賞

今年もSSII

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

viser:Pythonで使える3D可視化ライブラリ

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

サービスを成長させるための『グロースハック』という仕事

ManuelBastioniLAB:人体モデリングできるBlenderアドオン

ディープラーニング

胡散臭いデザインの参考サイト

UnityでARKit2.0

コメント

  1. […] OpenCVのバージョン3が正式リリースされたぞ […]