書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。


スポンサーリンク


本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。



画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた。↓ The OpenGV library OpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的...

複数視点画像から3次元形状を復元するライブラリ『openMVG』
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった。↓こっちのopenMVG...

https://blog.negativemind.com/2014/05/30/structure-from-motion-%E5%A4%9A%E8%A6%96%E7%82%B9%E7%94%BB%E5%83%8F%E3%81%8B%E3%82%89%E3%81%AE3%E6%AC%A1%E5%85%83%E5%BD%A2%E7%8A%B6%E5%BE%A9%E5%85%83/
OpenCVベースのマーカーARライブラリ『OpenAR』
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装し...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴ...


スポンサーリンク

関連記事

CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
FacebookがDeep learningツールの一部をオープンソース化
続・ディープラーニングの資料
ニューラルネットワークの構造を可視化するフレームワーク『TensorSpace.js』
PCA (主成分分析)
iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
統計的な顔モデル
WordPressの表示を高速化する
映画『仮面ライダー1号』を観て来た(ネタバレあり)
RefineNet (Multi-Path Refinement Network):ディープラーニン...
自分を育てる技術
Unity ARKitプラグインサンプルのチュートリアルを読む
UnityのGameObjectの向きをScriptで制御する
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
映画『オデッセイ』を観てきた
映画『ドラゴンボール超 ブロリー』を観た (ややネタバレ)
ポイントクラウドコンソーシアム
Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ
AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う
UnityのTransformクラスについて調べてみた
OpenCVベースのマーカーARライブラリ『OpenAR』
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
Pythonのソースコードに特化した検索エンジン『Nullege』
オープンソースの取引プラットフォーム
Arduinoで作るダンボーみたいなロボット『ピッコロボ』
GoogleのDeep Learning論文
網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した
小説『GODZILLA 怪獣黙示録』読了(ネタバレ無し)
PGGAN:段階的に解像度を上げて学習を進めるGAN
HerokuでMEAN stack
iOSで使えるJetpac社の物体認識SDK『DeepBelief』
Perfumeのライブパフォーマンスのビジュアル
書籍『鈴木さんにも分かるネットの未来』読了
OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる
iPhoneで3D写真が撮れるアプリ『seene』
書籍『グラビアアイドルの仕事論』読了
映画『ブレードランナー 2049』を観た (ネタバレ無し)
Deep Learningとその他の機械学習手法の性能比較
顔追跡による擬似3D表示『Dynamic Perspective』
ニューラルネットワークと深層学習
Google App Engine上のWordPressでFlickrの画像を貼る
ディープラーニング

コメント