OpenCVのバージョン3が正式リリースされたぞ

6月4日付でついにOpenCV 3.0の正式版がリリースされた。

さっそくOpenCV公式ページからインストーラーをダウンロードしたら、ページ上で以下の動画が再生された。

Google Summer Of Code 2014 contributions for OpenCV

これはGoogle Summer Of Code(GSoC) 2014の成果をまとめたムービーで、そのうちOpenCVに取り込まれるかもしれない機能らしい。GSoC自体はOpenCVだけじゃなくて、PCLなど、他のOSS向けプロジェクトもあるみたい。

この動画の中で個人的に気になっている機能が2つある。1つは、被写体の色成分と反射成分を分離するIntrinsic Image Decompositionという機能。そしてもう1つは、DTAM(Dense Tracking and Mapping)という技術を実装した機能。

DTAMとは？

DTAMは単眼カメラでリアルタイムに3次元空間をトラッキングする技術。良く知らなかったんだけど、登場したのは結構前で、2011年にICCVで発表されたものらしい。
まだ粗い理解だから大ざっぱに言うと、同じく単眼カメラによるリアルタイム3次元トラッキング技術として有名なPTAM(Parallel Tracking and Mapping)との大きな違いは、PTAMが疎な特徴点をベースに再構成を行うのに対して、DTAMでは画素単位で密に再構成を行うという点。(まあ、”Dense”という名前の通りですね)

調べてたらこんな資料を見つけたのでのんびり読もうと思う。↓

OpenCV 3.0自体は、全体の名前空間が整理されて、C++インターフェイスへの統一が図られてるっぽいので、構成がだいぶモダンになった印象。
dandelionさんがOpenCV 3.0のサマリーを何となく日本語訳したものを公開している。

GSoC 2013，2014プロジェクトの成果がOpenCV 3.0やopencv_contribに取り込まれました．

text detection

many computational photography algorithms (HDR, inpainting, edge-aware filters, superpixels, …)

tracking and optical flow algorithms

new features, including line descriptors, KAZE/AKAZE

general use optimization (hill climbing, linear programming)

greatly improved Python support, including Python 3.0 support, many new tutorials & samples on how to use OpenCV with Python.

2d shape matching module and 3d surface matching module

RGB-D module

VTK-based 3D visualization module

2015/07/28 追記：
dandelionさんがBuild Insiderの記事をOpenCV 3.0対応版に改訂したみたい。

OpenCVとは？最新3.0の新機能概要とモジュール構成

OpenCV 3.0ではOpenCV 2.4.xにあったモジュールのうち、一部のモジュールが、機能ごとに細分化されています。そのため、OpenCV 2.4.xのコードを3.0でも流用する場合は注意が必要です。

モジュール名（2.4.x）モジュール名（3.0）細分化の概要

highgui highgui GUI（ウィンドウ表示）左記のように、機能ごとにモジュールが細分化

imgcodecs 画像ファイル入出力

videoio 動画ファイルの入出力、カメラキャプチャ

gpu cudaarithm 機能ごとにモジュールが細分化
（※各機能の説明は割愛）

cudabgsegm

cudacodec

cudafeatures2d

cudafilters

cudaimgproc

cudalegacy

cudaobjdetect

cudaoptflow

cudastereo

cudawarping

cudev

モジュール名（2.4.x）	モジュール名（3.0）	細分化の概要
highgui	highgui	GUI（ウィンドウ表示）	左記のように、機能ごとにモジュールが細分化
imgcodecs	画像ファイル入出力
videoio	動画ファイルの入出力、カメラキャプチャ
gpu	cudaarithm	機能ごとにモジュールが細分化（※各機能の説明は割愛）
cudabgsegm
cudacodec
cudafeatures2d
cudafilters
cudaimgproc
cudalegacy
cudaobjdetect
cudaoptflow
cudastereo
cudawarping
cudev

この辺は気を付けよう。

2015/09/15追記：
OpenCV3.0に対応した日本語の書籍が出るようです。↓

2015/10/03追記：
購入した↓
https://blog.negativemind.com/2015/10/03/opencv-3-programing-book/

OpenCVで顔のモーフィングを実装する

uvでWindows11のPython環境を管理する

OpenCVでiPhone6sのカメラをキャリブレーションする

OpenAR：OpenCVベースのマーカーARライブラリ

iPhoneをエレキギターのアンプにする

Unity ARKitプラグインサンプルのドキュメントを読む

仮想関数

株式会社ヘキサドライブの研究室ページ

OpenCVで動画の手ぶれ補正

HD画質の無駄遣い

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

Point Cloud Utils：Pythonで3D点群・Meshを扱うライブラリ

ReadCube：文献管理ツール

OpenVDB：3Dボリュームデータ処理ライブラリ

大人用変身ベルト『仮面ライダーディケイドディケイドライバー』

トランスフォーマー/リベンジ Blue-Ray 予約開始

Web経由でRaspberry PiのGPIOを操作したい

SegNet：ディープラーニングによるSemantic Segmentation手法

Active Appearance Models（AAM）

立体視を試してみた

書籍『データビジュアライゼーションのデザインパターン20』読了

Googleが画像解析旅行ガイドアプリのJetpac社を買収

NeRF (Neural Radiance Fields)：深層学習による新規視点合成

iPhone x ロボットハッカソン～RomoのiPhone用SDKで目覚ましアプリを作る～

cvui：OpenCVのための軽量GUIライブラリ

まだまだ続く空想科学読本

PowerPointによるプレゼン

WebGL開発に関する情報が充実してきている

書籍『映画監督坂本浩一全仕事』読了

書籍『The Art of Mystical Beasts』を購入

ポイントクラウドコンソーシアム

HackerスペースとMakerスペース

OpenCVの超解像(SuperResolution)モジュールを試す

統計的な顔モデル

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート