書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。


スポンサーリンク


本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。



OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ
2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた↓ The OpenGV library OpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的に行うため...

openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。 この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓ こっちのopenMVG(Mul...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR:OpenCVベースのマーカーARライブラリ
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。 OPENAR: OPENCV AUGMENTED REALITY PROGRAM OpenARはマーカーベースのARをC++でシンプルに実装したも...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。 ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴ...


スポンサーリンク

関連記事

TorchStudio:PyTorchのための統合開発環境とエコシステム
3Dモデルを立体視で確認できるVRアプリを作っている
Unite 2014の動画
PS4用ソフト『ゴジラ-GODZILLA-VS』をプレイした
CycleGAN:ドメイン関係を学習した画像変換
映画『ゴースト・イン・ザ・シェル』を見た (ややネタバレ)
Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ
CLO:服飾デザインツール
UnityでARKit2.0
pythonもかじってみようかと
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
3DCG Meetup #4に行ってきた
OpenCVのバージョン3が正式リリースされたぞ
『劇場版 ウルトラマンジード つなぐぜ! 願い!!』を観てきた
MeshroomでPhotogrammetry
Live CV:インタラクティブにComputer Visionコーディングができるツール
ニューラルネットワークと深層学習
自分を育てる技術
映画『ゴジラ キング・オブ・モンスターズ』を観てきた (ネタバレ無し)
今年もSSII
ミニ四駆を改造してBluetoothラジコン化する
書籍『仕事ではじめる機械学習』を読みました
Multi-View Environment:複数画像から3次元形状を再構築するライブラリ
書籍『データビジュアライゼーションのデザインパターン20』読了
インターフェイスは世界を規定する
映画から想像するVR・AR時代のGUIデザイン
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
Unityの各コンポーネント間でのやり取り
Mitsuba 3:オープンソースの研究向けレンダラ
OpenMayaのPhongShaderクラス
OpenMesh:オープンソースの3Dメッシュデータライブラリ
AmazonEC2のインスタンスをt1.microからt2.microへ移行する
映画『シン・ウルトラマン』を観た! (ネタバレ有り)
機械学習手法『Random Forest』
立体視を試してみた
映画『BRAVE STORM』をMX4Dで観てきた (ネタバレ無し)
劇場版『仮面ライダーエグゼイド トゥルーエンディング』を観た (ネタバレ無し)
映画『ハン・ソロ/スター・ウォーズ・ストーリー』を観た (ネタバレ無し)
映画『ゴジラ-1.0』を4DX SCREENで鑑賞 (ネタバレあり)
PCA (主成分分析)
写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』
Deep Learningとその他の機械学習手法の性能比較

コメント