6月4日付でついにOpenCV 3.0の正式版がリリースされた。
さっそくOpenCV公式ページからインストーラーをダウンロードしたら、ページ上で以下の動画が再生された。
Google Summer Of Code 2014 contributions for OpenCV
これはGoogle Summer Of Code(GSoC) 2014の成果をまとめたムービーで、そのうちOpenCVに取り込まれるかもしれない機能らしい。GSoC自体はOpenCVだけじゃなくて、PCLなど、他のOSS向けプロジェクトもあるみたい。
スポンサーリンク
この動画の中で個人的に気になっている機能が2つある。1つは、被写体の色成分と反射成分を分離するIntrinsic Image Decompositionという機能。そしてもう1つは、DTAM(Dense Tracking and Mapping)という技術を実装した機能。
DTAMとは?
DTAMは単眼カメラでリアルタイムに3次元空間をトラッキングする技術。良く知らなかったんだけど、登場したのは結構前で、2011年にICCVで発表されたものらしい。
まだ粗い理解だから大ざっぱに言うと、同じく単眼カメラによるリアルタイム3次元トラッキング技術として有名なPTAM(Parallel Tracking and Mapping)との大きな違いは、PTAMが疎な特徴点をベースに再構成を行うのに対して、DTAMでは画素単位で密に再構成を行うという点。(まあ、”Dense”という名前の通りですね)
調べてたらこんな資料を見つけたのでのんびり読もうと思う。↓
OpenCV 3.0自体は、全体の名前空間が整理されて、C++インターフェイスへの統一が図られてるっぽいので、構成がだいぶモダンになった印象。
dandelionさんがOpenCV 3.0のサマリーを何となく日本語訳したものを公開している。
スポンサーリンク
GSoC 2013,2014プロジェクトの成果がOpenCV 3.0やopencv_contribに取り込まれました.
- text detection
- many computational photography algorithms (HDR, inpainting, edge-aware filters, superpixels, …)
- tracking and optical flow algorithms
- new features, including line descriptors, KAZE/AKAZE
- general use optimization (hill climbing, linear programming)
- greatly improved Python support, including Python 3.0 support, many new tutorials & samples on how to use OpenCV with Python.
- 2d shape matching module and 3d surface matching module
- RGB-D module
- VTK-based 3D visualization module
2015/07/28 追記:
dandelionさんがBuild Insiderの記事をOpenCV 3.0対応版に改訂したみたい。
OpenCVとは? 最新3.0の新機能概要とモジュール構成
OpenCV 3.0ではOpenCV 2.4.xにあったモジュールのうち、一部のモジュールが、機能ごとに細分化されています。そのため、OpenCV 2.4.xのコードを3.0でも流用する場合は注意が必要です。
モジュール名(2.4.x) モジュール名(3.0) 細分化の概要 highgui highgui GUI(ウィンドウ表示) 左記のように、機能ごとにモジュールが細分化 imgcodecs 画像ファイル入出力 videoio 動画ファイルの入出力、カメラキャプチャ gpu cudaarithm 機能ごとにモジュールが細分化
(※各機能の説明は割愛)cudabgsegm cudacodec cudafeatures2d cudafilters cudaimgproc cudalegacy cudaobjdetect cudaoptflow cudastereo cudawarping cudev
この辺は気を付けよう。
2015/09/15追記:
OpenCV3.0に対応した日本語の書籍が出るようです。↓
2015/10/03追記:
購入した↓
https://blog.negativemind.com/2015/10/03/opencv-3-programing-book/
スポンサーリンク
関連記事
それぞれの媒質の屈折率
オープンソースのIT資産・ライセンス管理システム『Snipe-IT』
統計的な顔モデル
エニアグラム
オープンソースのプリント基板設計ツール『KiCad』
ubuntuでサーバー作るよ
機械学習に役立つPythonライブラリ一覧
ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
PyTorch3D:3Dコンピュータービジョンライブラリ
hloc:SuperGlueで精度を向上させたSfM実装
Google App Engine上のWordPressでAmazonJSを利用する
書籍『「あなた」という商品を高く売る方法』読了
BlenderでPhotogrammetryできるアドオン
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
OpenCVで顔のモーフィングを実装する
MPFB2:Blenderの人体モデリングアドオン
MFnDataとMFnAttribute
CycleGAN:ドメイン関係を学習した画像変換
PowerPointによるプレゼン
Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
PyDataTokyo主催のDeep Learning勉強会
Webスクレイピングの勉強会に行ってきた
サンライズの勇者シリーズ30周年
第25回コンピュータビジョン勉強会@関東に行って来た
GoogleのDeep Learning論文
ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る
Raspberry Pi 2のGPIOピン配置
python-twitterで自分のお気に入りを取得する
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
Maya API Reference
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
viser:Pythonで使える3D可視化ライブラリ
Chevy shows off Transformers: Revenge of the Falle...
Deep Fluids:流体シミュレーションをディープラーニングで近似する
Math.NET Numerics:Unityで使える数値計算ライブラリ
胡散臭いデザインの参考サイト
池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』
ブログが1日ダウンしてました
SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番
コメント
[…] OpenCVのバージョン3が正式リリースされたぞ […]