書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。


スポンサーリンク


本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。



画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた。↓ The OpenGV library OpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的...

openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓こっちのopenMVG(...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenCVベースのマーカーARライブラリ『OpenAR』
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴ...


スポンサーリンク

関連記事

ニューラルネットワークと深層学習
Deep Learningとその他の機械学習手法の性能比較
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
映画『この世界の(さらにいくつもの)片隅に』を観た
Model View Controller
オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート
映画『ジュラシック・ワールド』を観た
映画『スター・ウォーズ/フォースの覚醒』を観た (ネタバレ無し)
MRenderUtil::raytrace
畳み込みニューラルネットワーク (CNN:Convolutional Neural Network)
OpenSfM:PythonのStructure from Motionライブラリ
CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
OpenCV 3.1のsfmモジュールを試す
Unity ARKitプラグインサンプルのドキュメントを読む
映画『アベンジャーズ/エイジ・オブ・ウルトロン』をMX4Dで観てきた (ネタバレ無し)
OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる
顔追跡による擬似3D表示『Dynamic Perspective』
映画『GODZILLA 星を喰う者』を観た (ややネタバレ)
人間の顔をそっくりそのままCGで復元する『Digital Emily Project』
pythonもかじってみようかと
映画『GODZILLA 怪獣惑星』を観た (ネタバレ無し)
Kinect for Windows v2の日本価格決定
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
MVStudio:オープンソースのPhotogrammetryツール
PyTorch3D:3Dコンピュータービジョンライブラリ
サンプルコードにも間違いはある?
iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
Mayaのプラグイン開発
書籍『開田裕治 怪獣イラストテクニック』
ディズニー映画『ズートピア』を観た
フォトンの放射から格納までを可視化した動画
続・ディープラーニングの資料
Google App Engine上のWordPressでFlickrの画像を貼る
オープンソースハードウェア Arduino (アルドゥイーノ)
まだまだ続く空想科学読本
映画『オデッセイ』を観てきた
COLMAP:オープンソースのSfM・MVSツール
モバイルに最適なBluetoothワイヤレスマウス 『CAPCLIP』
ブラウザ操作自動化ツール『Selenium』を試す
GAN (Generative Adversarial Networks):敵対的生成ネットワーク
Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

コメント