書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。


スポンサーリンク


本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。



画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた。↓ The OpenGV library OpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的...

複数視点画像から3次元形状を復元するライブラリ『openMVG』
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった。↓こっちのopenMVG...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenCVベースのマーカーARライブラリ『OpenAR』
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装し...

OpenCVベースのコンパクトなARライブラリ『ArUco』
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴ...


スポンサーリンク

関連記事

Leap MotionでMaya上のオブジェクトを操作できるプラグイン
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ
Maya API Reference
adskShaderSDK
Mechanizeで要認証Webサイトをスクレイピング
UnityのuGUIチュートリアル
映画『ブレードランナー 2049』を観た (ネタバレ無し)
WordPressのテーマを自作する
Arduinoで作るダンボーみたいなロボット『ピッコロボ』
タイミングとクオリティ
『劇場版シティーハンター 〈新宿プライベート・アイズ〉』を観た
Point Cloud Libraryに動画フォーマットが追加されるらしい
SONY製のニューラルネットワークライブラリ『NNabla』
書籍『「あなた」という商品を高く売る方法』読了
Facebookの顔認証技術『DeepFace』
MFnDataとMFnAttribute
映画『ゴースト・イン・ザ・シェル』を見た (ややネタバレ)
UnityでTweenアニメーションを実装できる3種類の無料Asset
軽量なジオメトリ処理ライブラリ『libigl』
クラスの基本
Unityからkonashiをコントロールする
Mayaのシェーディングノードの区分
Unityの薄い本
Raspberry Pi
Unityで学ぶC#
オープンソースの物理ベースGIレンダラ『appleseed』
なんかすごいサイト
株式会社ヘキサドライブの研究室ページ
複数画像から3次元形状を再構築するライブラリ『Multi-View Environment』
ヒーローに変身なりきりアーケードゲーム『ナレルンダー』
『S.H.Figuarts 仮面ライダー3号』が発売された
Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方
インタラクティブにComputer Visionコーディングができるツール『Live CV』
画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
C++の抽象クラス
SegNet:ディープラーニングによるSemantic Segmentation手法
PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...
Boost オープンソースライブラリ
BlenderでPhotogrammetryできるアドオン
HD画質の無駄遣い その2
科学技術計算向けスクリプト言語『Julia』

コメント