OpenCVのバージョン3が正式リリースされたぞ

6月4日付でついにOpenCV 3.0の正式版がリリースされた。

さっそくOpenCV公式ページからインストーラーをダウンロードしたら、ページ上で以下の動画が再生された。

Google Summer Of Code 2014 contributions for OpenCV

これはGoogle Summer Of Code(GSoC) 2014の成果をまとめたムービーで、そのうちOpenCVに取り込まれるかもしれない機能らしい。GSoC自体はOpenCVだけじゃなくて、PCLなど、他のOSS向けプロジェクトもあるみたい。

この動画の中で個人的に気になっている機能が2つある。1つは、被写体の色成分と反射成分を分離するIntrinsic Image Decompositionという機能。そしてもう1つは、DTAM(Dense Tracking and Mapping)という技術を実装した機能。

DTAMとは？

DTAMは単眼カメラでリアルタイムに3次元空間をトラッキングする技術。良く知らなかったんだけど、登場したのは結構前で、2011年にICCVで発表されたものらしい。
まだ粗い理解だから大ざっぱに言うと、同じく単眼カメラによるリアルタイム3次元トラッキング技術として有名なPTAM(Parallel Tracking and Mapping)との大きな違いは、PTAMが疎な特徴点をベースに再構成を行うのに対して、DTAMでは画素単位で密に再構成を行うという点。(まあ、”Dense”という名前の通りですね)

調べてたらこんな資料を見つけたのでのんびり読もうと思う。↓

OpenCV 3.0自体は、全体の名前空間が整理されて、C++インターフェイスへの統一が図られてるっぽいので、構成がだいぶモダンになった印象。
dandelionさんがOpenCV 3.0のサマリーを何となく日本語訳したものを公開している。

GSoC 2013，2014プロジェクトの成果がOpenCV 3.0やopencv_contribに取り込まれました．

text detection

many computational photography algorithms (HDR, inpainting, edge-aware filters, superpixels, …)

tracking and optical flow algorithms

new features, including line descriptors, KAZE/AKAZE

general use optimization (hill climbing, linear programming)

greatly improved Python support, including Python 3.0 support, many new tutorials & samples on how to use OpenCV with Python.

2d shape matching module and 3d surface matching module

RGB-D module

VTK-based 3D visualization module

2015/07/28 追記：
dandelionさんがBuild Insiderの記事をOpenCV 3.0対応版に改訂したみたい。

OpenCVとは？最新3.0の新機能概要とモジュール構成

OpenCV 3.0ではOpenCV 2.4.xにあったモジュールのうち、一部のモジュールが、機能ごとに細分化されています。そのため、OpenCV 2.4.xのコードを3.0でも流用する場合は注意が必要です。

モジュール名（2.4.x）モジュール名（3.0）細分化の概要

highgui highgui GUI（ウィンドウ表示）左記のように、機能ごとにモジュールが細分化

imgcodecs 画像ファイル入出力

videoio 動画ファイルの入出力、カメラキャプチャ

gpu cudaarithm 機能ごとにモジュールが細分化
（※各機能の説明は割愛）

cudabgsegm

cudacodec

cudafeatures2d

cudafilters

cudaimgproc

cudalegacy

cudaobjdetect

cudaoptflow

cudastereo

cudawarping

cudev

モジュール名（2.4.x）	モジュール名（3.0）	細分化の概要
highgui	highgui	GUI（ウィンドウ表示）	左記のように、機能ごとにモジュールが細分化
imgcodecs	画像ファイル入出力
videoio	動画ファイルの入出力、カメラキャプチャ
gpu	cudaarithm	機能ごとにモジュールが細分化（※各機能の説明は割愛）
cudabgsegm
cudacodec
cudafeatures2d
cudafilters
cudaimgproc
cudalegacy
cudaobjdetect
cudaoptflow
cudastereo
cudawarping
cudev

この辺は気を付けよう。

2015/09/15追記：
OpenCV3.0に対応した日本語の書籍が出るようです。↓

2015/10/03追記：
購入した↓
https://blog.negativemind.com/2015/10/03/opencv-3-programing-book/

Unityの各コンポーネント間でのやり取り

Iridescence：プロトタイピング向け軽量3D可視化ライブラリ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

ブログのデザイン変えました

BlenderのPython環境にPyTorchをインストールする

PGGAN：段階的に解像度を上げて学習を進めるGAN

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

Blender 2.8がついに正式リリース！

Pylearn2：ディープラーニングに対応したPythonの機械学習ライブラリ

SSD (Single Shot Multibox Detector)：ディープラーニングによる一般...

Netron：機械学習モデルを可視化するツール

科学技術計算向けスクリプト言語『Julia』

インターフェイスは世界を規定する

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

Mitsuba 3：オープンソースの研究向けレンダラ

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

ベイズ推定とグラフィカルモデル

自前のShaderがおかしい件

顔追跡による擬似3D表示『Dynamic Perspective』

R-CNN (Regions with CNN features)：ディープラーニングによる一般物体...

Active Appearance Models（AAM）

ニューラルネットワークで画像分類

UnityでPoint Cloudを表示する方法

ブログをGoogle App EngineからAmazon EC2へ移行

Qlone：スマホのカメラで3Dスキャンできるアプリ

PyMC：Pythonのベイズ統計ライブラリ

Pix2Pix：CGANによる画像変換

Profilograph

クライマックスヒーローズ

ミニ四駆を赤外線制御したりUnityと連携したり

プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)

Yahoo!で「トランスフォーマー！」を検索すると

円谷プロダクションクリエイティブアワード金城哲夫賞

今年もSSII

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

viser：Pythonで使える3D可視化ライブラリ

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

サービスを成長させるための『グロースハック』という仕事

ManuelBastioniLAB：人体モデリングできるBlenderアドオン

ディープラーニング

胡散臭いデザインの参考サイト

UnityでARKit2.0