書籍『OpenCV 3 プログラミングブック』を購入

AR

2015.10.032020.09.29

発売前から結構気になっていたので「OpenCV 3 プログラミングブック」を購入した。

本書の解説で使用しているサンプルコードは書籍のサポートサイトからダウンロードできる。

本書の構成は、OpenCVの入門書と言うよりも、画像認識技術を用いたAR・VR・インタラクティブアプリケーションの開発を始めたい人に最適な感じ。理論よりは実践の割合が多いのでとっつきやすい。

OpenCV開発環境の導入・デバッグ方法の基本的な説明から始まり、3次元幾何の概要説明、OpenCVとOpenGLによるAR合成の実装、今流行のディープラーニングフレームワークCaffeをOpenCVから利用する方法、プロジェクションマッピング、Oculus Riftで表示するための画像加工、KinectV2、そしてOpenCL連携(バージョン3の新機能UMat)についてと、時代のニーズに合わせた情報をコンパクトにまとめている。

実際にそういうアプリを作ってみたいけど、まだ経験の無い人には特に有難い書籍だと思う。逆に言うと、ある意味偏った内容なので、純粋に画像認識技術に入門したい人にはちょっと焦点がわからない構成かもしれない。詳しい理論体系は別で学びましょう。

オイラはというと、一番の目当ては5,6章の3次元幾何とかカメラ画像との合成まわり。カメラ位置・姿勢推定について、数式だけじゃなくてソースコードで追えるのがとても有難いのです。(数式読むの苦手なので…)

OpenCV 2の時に出ていた書籍と内容はほとんどかぶっていないので、両方持っていると良いかも。

OpenGV：画像からカメラの3次元位置・姿勢を推定するライブラリ

2D画像からの3D情報復元について調べていたらこんなオープンソースライブラリを見つけた↓The OpenGV libraryOpenGVライブラリは、キャリブレーション済みカメラの姿勢計算に必要となる幾何学アルゴリズムを効率的に行うために設...

openMVG：複数視点画像から3次元形状を復元するライブラリ

最近、この手の2D→3D復元系のライブラリを色々と調べている。何となく、自分で3D復元ツールを作ってみたくてね。この間のOpenGVは複数画像からカメラ(視点)の3次元位置・姿勢を推定するライブラリだった↓こっちのopenMVG(Multi...

Structure from Motion (多視点画像からの3次元形状復元)

3DCGをガッツリ学んでたもんで、「2次元の画像処理よりも3次元のCGの方が抽象度が高くて美しい」という感覚があって、コンピュータビジョンに対して「お前らとは次元が違うんだよ」とか思ってたんだけど、最近のコンピュータビジョンは結構3次元なの...

OpenAR：OpenCVベースのマーカーARライブラリ

Twitterで知ったんだけど、OpenARっていう、マーカーARのライブラリがあるらしい。OPENAR: OPENCV AUGMENTED REALITY PROGRAMOpenARはマーカーベースのARをC++でシンプルに実装したもので...

ArUco：OpenCVベースのコンパクトなARライブラリ

最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテ...

関連記事

UnityでLight Shaftを表現する

Unity Scriptコーディング→Unreal Engine Scriptコーディング

OpenCV 3.1のsfmモジュールを試す

機械学習手法『Random Forest』

書籍『メイキング・オブ・ピクサー創造力をつくった人々』を読んだ

Raspberry Pi 2のGPIOピン配置

このブログのデザインに飽きてきた

粘土をこねるようなスカルプトモデリング

オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う

3D復元技術の情報リンク集

シフトカーを改造してラジコン化する人達

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Raspberry Pi

PeopleSansPeople：機械学習用の人物データをUnityで生成する

Photogrammetry (写真測量法)

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

Geogram：C++の3D幾何アルゴリズムライブラリ

Math Inspector：科学計算向けビジュアルプログラミングツール

ブログが1日ダウンしてました

WordPressのサーバ引っ越し方法を考える

Active Appearance Models（AAM）

C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』

OpenFace：Deep Neural Networkによる顔の個人識別フレームワーク

iOSデバイスと接続して連携するガジェットの開発方法

OpenCV 3.1のsfmモジュールのビルド再び

OpenSfM：PythonのStructure from Motionライブラリ

Alice Vision：オープンソースのPhotogrammetryフレームワーク

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

世界一下品なクマと世界一紳士なクマ

ムービーモンスターシリーズゴジラ 2016 発売

Gource：バージョン管理の履歴を可視化するツール

NeRF (Neural Radiance Fields)：深層学習による新規視点合成

Unity ARKitプラグインサンプルのチュートリアルを読む

SegNet：ディープラーニングによるSemantic Segmentation手法

CLO：服飾デザインツール

Oculus Quest 2を購入！

OpenCVのバージョン3が正式リリースされたぞ

書籍『ジ・アート・オブ・シン・ゴジラ』の発売日が2016年12月30日(金)に決定

Unreal Engineの薄い本

円谷プロダクションクリエイティブアワード金城哲夫賞

uvでWindows11のPython環境を管理する

Regard3D：オープンソースのStructure from Motionツール

コメント