書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。



本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。




openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓こっちのopenMVG(Multi...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR:OpenCVベースのマーカーARライブラリ
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装したもので...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテ...

関連記事

AmazonEC2のインスタンスをt1.microからt2....

ストレングス・ファインダー

Oculus Quest 2を購入!

DUSt3R:3Dコンピュータービジョンの基盤モデル

定数

Google製オープンソース機械学習ライブラリ『Tensor...

書籍『データビジュアライゼーションのデザインパターン20』読...

科学技術計算向けスクリプト言語『Julia』

FacebookがDeep learningツールの一部をオ...

Webサイトのワイヤーフレームが作成できるオンラインツール

SONY製のニューラルネットワークライブラリ『NNabla』

Google App Engine上のWordPressでA...

『S.H.Figuarts 仮面ライダー3号』が発売された

Fast R-CNN:ディープラーニングによる一般物体検出手...

機械学習手法『Random Forest』

書籍『The Art of Mystical Beasts』...

このブログのデザインに飽きてきた

書籍『クラッシャー上司 平気で部下を追い詰める人たち』読了

Amazon Web ServicesでWordPress

3D復元技術の情報リンク集

円谷プロダクション クリエイティブアワード 金城哲夫賞

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル ク...

iPhoneアプリ開発 Xcode 5のお作法

GAN (Generative Adversarial Ne...

書籍『自分の強みを見つけよう』読了

Unity ARKitプラグインサンプルのドキュメントを読む

まだまだ続く空想科学読本

RSSフィードを読込んで表示するWordpressプラグイン...

ミニ四駆を改造してBluetoothラジコン化する

UnrealCV:コンピュータビジョン研究のためのUnrea...

映画『ジュラシック・ワールド/炎の王国』を観た (ネタバレ無...

スクラッチで既存のキャラクターを立体化したい

映画『GODZILLA 星を喰う者』を観た (ややネタバレ)

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作っ...

Deep Fluids:流体シミュレーションをディープラーニ...

TensorFlowでCGを微分できる『TensorFlow...

Pythonのソースコードに特化した検索エンジン『Nulle...

Raspberry PiでIoTごっこ

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

書籍『医師のつくった「頭のよさ」テスト 認知特性から見た6つ...

Point Cloud Consortiumのセミナー「3D...

マルコフ連鎖モンテカルロ法

コメント