OpenCV

Build InsiderでOpenCV入門という連載が始まった。
OpenCVに触れたのは会社員になってからだった。それまでは画像処理でリアルタイムにこれほどの処理が可能だなんて思っていなかったな。
連載の第1回では概要が程よくまとまっていてわかりやすい。初めて触れた時にここまで俯瞰した情報に出会っていれば、もっと習得は早かったような気がする。自分が初学時に知りたかった情報を引用して抜粋。

OpenCVとは？その機能概要／構成技術／主要モジュール

1.2 OpenCVでできること

OpenCVを使うと利用できる機能のうち、比較的一般的にも知られている機能を以下にピックアップしました。また、この他、開発者自身が独自のアルゴリズムを実装するために用いることができる基本的な機能や、便利な機能も備えています。

モジュール名ライブラリ名（OpenCV 3.0）概要

core opencv_core300.lib 画像・行列データ構造の提供、配列操作、図形描画、XMLおよびYAML入出力、コマンドラインパーサー、ユーティリティ機能など

imgproc opencv_imgproc300.lib フィルター処理、アフィン変換、エッジ検出、ハフ検出、色変換、ヒストグラム計算、ラベリングなど

calib3d opencv_calib3d300.lib カメラキャリブレーション、ステレオ対応点探索

features2d opencv_features2d300.lib 特徴点抽出（ORB、BRISK、FREAKなど）

highgui opencv_highgui2d300.lib GUI（ウィンドウ表示、画像ファイル、動画ファイルの入出力、カメラキャプチャなど）

ml opencv_ml300.lib SVM、決定木、ブースティング、ニューラルネットワークなど

cuda opencv_cuda300.lib 画像処理のCUDA（GPGPU）実装

objdetect opencv_objdetect300.lib オブジェクト検出（顔検出、人体検出など）

photo opencv_photo300.lib 画像修復、ノイズ除去処理、HDR（High Dynamic Range）合成、画像合成など

shape opencv_shape300.lib 形状マッチング

stitching opencv_stitching300.lib パノラマ合成

superres opencv_superres300.lib 超解像処理

video opencv_video300.lib オプティカルフロー、カルマンフィルタ、背景差分など

viz opencv_viz300.lib 3Dデータの可視化（内部的にVTKを使用）

nonfree opencv_nonfree300.lib 一部の国で特許が取得されている、もしくは使用に制限がある可能性があるアルゴリズム（SIFT、SURF）

モジュール名	ライブラリ名（OpenCV 3.0）	概要
core	opencv_core300.lib	画像・行列データ構造の提供、配列操作、図形描画、XMLおよびYAML入出力、コマンドラインパーサー、ユーティリティ機能など
imgproc	opencv_imgproc300.lib	フィルター処理、アフィン変換、エッジ検出、ハフ検出、色変換、ヒストグラム計算、ラベリングなど
calib3d	opencv_calib3d300.lib	カメラキャリブレーション、ステレオ対応点探索
features2d	opencv_features2d300.lib	特徴点抽出（ORB、BRISK、FREAKなど）
highgui	opencv_highgui2d300.lib	GUI（ウィンドウ表示、画像ファイル、動画ファイルの入出力、カメラキャプチャなど）
ml	opencv_ml300.lib	SVM、決定木、ブースティング、ニューラルネットワークなど
cuda	opencv_cuda300.lib	画像処理のCUDA（GPGPU）実装
objdetect	opencv_objdetect300.lib	オブジェクト検出（顔検出、人体検出など）
photo	opencv_photo300.lib	画像修復、ノイズ除去処理、HDR（High Dynamic Range）合成、画像合成など
shape	opencv_shape300.lib	形状マッチング
stitching	opencv_stitching300.lib	パノラマ合成
superres	opencv_superres300.lib	超解像処理
video	opencv_video300.lib	オプティカルフロー、カルマンフィルタ、背景差分など
viz	opencv_viz300.lib	3Dデータの可視化（内部的にVTKを使用）
nonfree	opencv_nonfree300.lib	一部の国で特許が取得されている、もしくは使用に制限がある可能性があるアルゴリズム（SIFT、SURF）

ネット検索で情報を集めようとすると、断片ばかりが集まって、なかなかこういう全体像にたどり着けなくて苦しい思いをする。
初めて見た記事のサンプルコードがバージョン1.x系だったりすると、後々悲惨。

Gource：バージョン管理の履歴を可視化するツール

タイミングとクオリティ

機械学習に役立つPythonライブラリ一覧

Alice Vision：オープンソースのPhotogram...

OpenMVSのサンプルを動かしてみる

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

写真に3Dオブジェクトを違和感無く合成する『3DPhotoM...

Arduinoで作るダンボーみたいなロボット『ピッコロボ』

Mechanizeで要認証Webサイトをスクレイピング

Google製オープンソース機械学習ライブラリ『Tensor...

BlenderでPhotogrammetryできるアドオン

Kubric：機械学習用アノテーション付き動画生成パイプライ...

Raspberry Pi

Russian3DScannerのトポロジー転送ツール『Wr...

PythonでMayaのShapeノードプラグインを作る

R-CNN (Regions with CNN featur...

C++始めようと思うんだ

TensorFlowでCGを微分できる『TensorFlow...

1枚の画像からマテリアルを作成できる無料ツール『Materi...

AMIMOTO（PVM版）で作成したインスタンスをAMIMO...

TorchStudio：PyTorchのための統合開発環境と...

AnacondaとTensorFlowをインストールしてVi...

OpenCVで平均顔を作るチュートリアル

SDカードサイズのコンピューター『Intel Edison』

OpenMVS：Multi-View Stereoによる3次...

Google Chromecast

Theia：オープンソースのStructure from M...

Polyscope：3Dデータ操作用GUIライブラリ

オープンソースの顔の動作解析ツールキット『OpenFace』

SONYの自律型エンタテインメントロボット『aibo』

Twitter APIのPythonラッパー『python-...

VGGT：マルチビュー・フィードフォワード型3Dビジョン基盤...

openMVG：複数視点画像から3次元形状を復元するライブラ...

BGSLibrary：OpenCVベースの背景差分ライブラリ

Google App EngineでWordPress

iPhone・iPod touchで動作する知育ロボット『R...

Raspberry Piでセンサーの常時稼働を検討する

GeoGebra：無料で使える数学アプリ

UnityのTransformクラスについて調べてみた

iPadをハンディ3Dスキャナにするガジェット『iSense...

openMVGをWindows10 Visual Studi...

SSD (Single Shot Multibox Dete...

OpenCV

OpenCVとは？その機能概要／構成技術／主要モジュール

関連記事

コメント

OpenCVとは？ その機能概要／構成技術／主要モジュール

関連記事

コメント

個人情報に関するお知らせ

OpenCVとは？その機能概要／構成技術／主要モジュール