書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。


スポンサーリンク


本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。



OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ
2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた↓ The OpenGV library OpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的に行うため...

openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。 この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓ こっちのopenMVG(Mul...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR:OpenCVベースのマーカーARライブラリ
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。 OPENAR: OPENCV AUGMENTED REALITY PROGRAM OpenARはマーカーベースのARをC++でシンプルに実装したも...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。 ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴ...


スポンサーリンク

関連記事

映画『この世界の(さらにいくつもの)片隅に』を観た
オープンソースの顔認識フレームワーク『OpenBR』
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
ManuelBastioniLAB:人体モデリングできるBlenderアドオン
Qlone:スマホのカメラで3Dスキャンできるアプリ
Mitsuba 3:オープンソースの研究向けレンダラ
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...
OpenMayaRender
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
科学技術計算向けスクリプト言語『Julia』
Kinect for Windows v2の日本価格決定
酒井ゆうじ 造形コレクション『ゴジラ1999』を購入
タマムシっぽい質感
IronPythonを使ってUnity上でPythonのコードを実行する
実写版『進撃の巨人』の後篇を観た(ネタバレあり)
書籍『映画監督 坂本浩一 全仕事』読了
SDカードサイズのコンピューター『Intel Edison』
hloc:SuperGlueで精度を向上させたSfM実装
Cartographer:オープンソースのSLAMライブラリ
PythonでBlenderのAdd-on開発
チャットツール用bot開発フレームワーク『Hubot』
世界一下品なクマと世界一紳士なクマ
Russian3DScannerのトポロジー転送ツール『WrapX』
ストレングス・ファインダー
FCN (Fully Convolutional Network):ディープラーニングによるSema...
網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した
adskShaderSDK
fSpy:1枚の写真からカメラパラメーターを割り出すツール
Super Resolution:OpenCVの超解像処理モジュール
オープンソースの取引プラットフォーム
DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
機械学習で遊ぶ
第1回 3D勉強会@関東『SLAMチュートリアル大会』
OpenCVのバージョン3が正式リリースされたぞ
Raspberry Pi
映画『ゴジラvsコング』を観てきた! (一応ネタバレ無し)
OpenGVのライブラリ構成
Digital Emily Project:人間の顔をそっくりそのままCGで復元する
.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...
Seleniumを使ったFXや株の自動取引
ムービーモンスターシリーズ ゴジラ 2016 発売
動的なメモリの扱い

コメント