書籍『OpenCV 3 プログラミングブック』を購入

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。



本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。



本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。




openMVG:複数視点画像から3次元形状を復元するライブラリ
最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓こっちのopenMVG(Multi...

Structure from Motion (多視点画像からの3次元形状復元)
3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR:OpenCVベースのマーカーARライブラリ
Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装したもので...

ArUco:OpenCVベースのコンパクトなARライブラリ
最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテ...

関連記事

ドラマ『ファーストクラス』のモーショングラフィックス

映画『スター・ウォーズ/最後のジェダイ』を観た (ネタバレ無し)

ManimML:機械学習の概念を視覚的に説明するためのライブラリ

Open3D:3Dデータ処理ライブラリ

Mean Stack開発の最初の一歩

まだまだ続く空想科学読本

書籍『人生は、運よりも実力よりも「勘違いさせる力」で決まっている』読了

『劇場版 ウルトラマンオーブ 絆の力、おかりします!』を観てきた

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

WordPress on Windows Azure

Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

機械学習手法『Random Forest』

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

libigl:軽量なジオメトリ処理ライブラリ

AMIMOTO(PVM版)で作成したインスタンスをAMIMOTO (HVM版)へ移行する

Fast R-CNN:ディープラーニングによる一般物体検出手法

手軽にRAID環境が構築できる高機能ストレージケース『Drobo(ドロボ)』

キャリアの振り返り

書籍『天才を殺す凡人』読了

OpenCVでiPhone6sのカメラをキャリブレーションする

書籍『ROSプログラミング』

Geogram:C++の3D幾何アルゴリズムライブラリ

UnityのGameObjectの向きをScriptで制御する

UnityプロジェクトをGitHubで管理する

CycleGAN:ドメイン関係を学習した画像変換

WordPress on Google App Engineを1週間運用してみて

ROMOハッカソンに行ってきた

CGAN (Conditional GAN):条件付き敵対的生成ネットワーク

Windows10でPyTorchをインストールしてVSCodeで使う

小説『GODZILLA 怪獣黙示録』読了(ネタバレ無し)

FCN (Fully Convolutional Network):ディープラーニングによるSema...

映画『ジュラシック・ワールド』を観た

映画『仮面ライダー1号』を観て来た(ネタバレあり)

Mayaのプラグイン開発

網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した

PythonのHTML・XMLパーサー『BeautifulSoup』

続・ディープラーニングの資料

Python拡張モジュールのWindows用インストーラー配布サイト

機械学習に役立つPythonライブラリ一覧

Russian3DScannerのトポロジー転送ツール『WrapX』

ニューラルネットワークと深層学習

コメント