書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。



本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。




openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓こっちのopenMVG(Multi...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR:OpenCVベースのマーカーARライブラリ
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装したもので...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテ...

関連記事

ニューラルネットワークで画像分類

顔追跡による擬似3D表示『Dynamic Perspecti...

UnityのuGUIチュートリアル

Unreal Engineの薄い本

映画『ハン・ソロ/スター・ウォーズ・ストーリー』を観た (ネ...

書籍『開田裕治 怪獣イラストテクニック』

OpenCV 3.3.0 contribのsfmモジュールの...

Pythonの自然言語処理ライブラリ『NLTK(Natura...

ZBrushで作った3Dモデルを立体視で確認できるVRアプリ...

なんかすごいサイト

Adobe MAX 2015

CGALDotNet:計算幾何学ライブラリ CGALのC#ラ...

Dlib:C++の機械学習ライブラリ

3Dモデルを立体視で確認できるVRアプリを作っている

Russian3DScannerのトポロジー転送ツール『Wr...

映画『スター・ウォーズ/スカイウォーカーの夜明け』を観た (...

uGUI:Unityの新しいGUI作成システム

NumSharp:C#で使えるNumPyライクな数値計算ライ...

オープンソースの物理ベースレンダラ『Mitsuba』をMay...

3DCG Meetup #4に行ってきた

Gource:バージョン管理の履歴を可視化するツール

組み込み向けのWindows OS 『Windows Emb...

映画『BRAVE STORM』をMX4Dで観てきた (ネタバ...

ミニ四駆を赤外線制御したりUnityと連携したり

Unity ARKitプラグインサンプルのチュートリアルを読...

オーバーロードとオーバーライド

CLO:服飾デザインツール

Open Shading Language (OSL)

WordPressの表示を高速化する

Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『...

注文してた本が届いた

畳み込みニューラルネットワーク (CNN: Convolut...

KelpNet:C#で使える可読性重視のディープラーニングラ...

OpenFace:Deep Neural Networkによ...

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方...

生物の骨格

映画『メッセージ』を観た

YOLO (You Only Look Once):ディープ...

Human Generator:Blenderの人体生成アド...

画像認識による位置情報取得 - Semi-Direct Mo...

Model View Controller

Mechanizeで要認証Webサイトをスクレイピング

コメント