OpenCVのバージョン3が正式リリースされたぞ

6月4日付でついにOpenCV 3.0の正式版がリリースされた。

さっそくOpenCV公式ページからインストーラーをダウンロードしたら、ページ上で以下の動画が再生された。

Google Summer Of Code 2014 contributions for OpenCV



これはGoogle Summer Of Code(GSoC) 2014の成果をまとめたムービーで、そのうちOpenCVに取り込まれるかもしれない機能らしい。GSoC自体はOpenCVだけじゃなくて、PCLなど、他のOSS向けプロジェクトもあるみたい。


スポンサーリンク


この動画の中で個人的に気になっている機能が2つある。1つは、被写体の色成分と反射成分を分離するIntrinsic Image Decompositionという機能。そしてもう1つは、DTAM(Dense Tracking and Mapping)という技術を実装した機能。

DTAMとは?

DTAMは単眼カメラでリアルタイムに3次元空間をトラッキングする技術。良く知らなかったんだけど、登場したのは結構前で、2011年にICCVで発表されたものらしい。
まだ粗い理解だから大ざっぱに言うと、同じく単眼カメラによるリアルタイム3次元トラッキング技術として有名なPTAM(Parallel Tracking and Mapping)との大きな違いは、PTAMが疎な特徴点をベースに再構成を行うのに対して、DTAMでは画素単位で密に再構成を行うという点。(まあ、”Dense”という名前の通りですね)



調べてたらこんな資料を見つけたのでのんびり読もうと思う。↓



OpenCV 3.0自体は、全体の名前空間が整理されて、C++インターフェイスへの統一が図られてるっぽいので、構成がだいぶモダンになった印象。
dandelionさんがOpenCV 3.0のサマリーを何となく日本語訳したものを公開している。


スポンサーリンク

GSoC 2013,2014プロジェクトの成果がOpenCV 3.0やopencv_contribに取り込まれました.

  • text detection
  • many computational photography algorithms (HDR, inpainting, edge-aware filters, superpixels, …)
  • tracking and optical flow algorithms
  • new features, including line descriptors, KAZE/AKAZE
  • general use optimization (hill climbing, linear programming)
  • greatly improved Python support, including Python 3.0 support, many new tutorials & samples on how to use OpenCV with Python.
  • 2d shape matching module and 3d surface matching module
  • RGB-D module
  • VTK-based 3D visualization module

2015/07/28 追記:
dandelionさんがBuild Insiderの記事をOpenCV 3.0対応版に改訂したみたい。

OpenCVとは? 最新3.0の新機能概要とモジュール構成

OpenCV 3.0ではOpenCV 2.4.xにあったモジュールのうち、一部のモジュールが、機能ごとに細分化されています。そのため、OpenCV 2.4.xのコードを3.0でも流用する場合は注意が必要です。

モジュール名(2.4.x) モジュール名(3.0) 細分化の概要
highgui highgui GUI(ウィンドウ表示) 左記のように、機能ごとにモジュールが細分化
imgcodecs 画像ファイル入出力
videoio 動画ファイルの入出力、カメラキャプチャ
gpu cudaarithm 機能ごとにモジュールが細分化
各機能の説明は割愛)
cudabgsegm
cudacodec
cudafeatures2d
cudafilters
cudaimgproc
cudalegacy
cudaobjdetect
cudaoptflow
cudastereo
cudawarping
cudev

この辺は気を付けよう。

2015/09/15追記:
OpenCV3.0に対応した日本語の書籍が出るようです。↓


OpenCV 3 プログラミングブック

2015/10/03追記:
購入した↓
https://blog.negativemind.com/2015/10/03/opencv-3-programing-book/


スポンサーリンク

関連記事

HackerスペースとMakerスペース
OpenVDB:3Dボリュームデータ処理ライブラリ
書籍『ゴジラの工房 若狭新一造形写真集』
機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...
タマムシ
Mechanizeで要認証Webサイトをスクレイピング
透明標本
openMVGをWindows10 Visual Studio 2015環境でビルドする
書籍『グラビアアイドルの仕事論』読了
ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
Raspberry Pi
UnityのGameObjectの向きをScriptで制御する
フルカラー3Dプリンタ
UnityのAR FoundationでARKit 3
Structure from Motion (多視点画像からの3次元形状復元)
書籍『メイキング・オブ・ピクサー 創造力をつくった人々』を読んだ
Open Shading Language (OSL)
書籍『AI vs. 教科書が読めない子どもたち』読了
オープンソースのプリント基板設計ツール『KiCad』
写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』
Unity ARKitプラグインサンプルのドキュメントを読む
モバイルに最適なBluetoothワイヤレスマウス 『CAPCLIP』
小説『GODZILLA プロジェクト・メカゴジラ』読了(ネタバレ無し)
Mayaのプラグイン開発
スマホでカラーチューニングできるペンライト『KING BLADE X10 III』
DMMが秋葉原にMakerスペース『DMM.make AKIBA』をオープン
OpenCVで顔のランドマークを検出する『Facemark API』
ゴジラのスマホゲーム『Godzilla: Strike Zone』
趣味でCEDECに来ている者だ
胡散臭いデザインの参考サイト
Python拡張モジュールのWindows用インストーラー配布サイト
Javaで作られたオープンソースの3DCGレンダラ『Sunflow』
Cartographer:オープンソースのSLAMライブラリ
ZBrushのZScript入門
Autodesk Mementoでゴジラを3次元復元する
BlenderでPhotogrammetryできるアドオン
網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した
Kubric:機械学習用アノテーション付き動画生成パイプライン
C++の抽象クラス
自分のスキルセット
Unity ARKitプラグインサンプルのチュートリアルを読む
畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

コメント

  1. […] OpenCVのバージョン3が正式リリースされたぞ […]