サイトアイコン NegativeMindException

OpenCV

Build InsiderOpenCV入門という連載が始まった。
OpenCVに触れたのは会社員になってからだった。それまでは画像処理でリアルタイムにこれほどの処理が可能だなんて思っていなかったな。
連載の第1回では概要が程よくまとまっていてわかりやすい。初めて触れた時にここまで俯瞰した情報に出会っていれば、もっと習得は早かったような気がする。自分が初学時に知りたかった情報を引用して抜粋。

OpenCVとは? その機能概要/構成技術/主要モジュール

1.2 OpenCVでできること

OpenCVを使うと利用できる機能のうち、比較的一般的にも知られている機能を以下にピックアップしました。また、この他、開発者自身が独自のアルゴリズムを実装するために用いることができる基本的な機能や、便利な機能も備えています。


スポンサーリンク
モジュール名 ライブラリ名(OpenCV 3.0) 概要
core opencv_core300.lib 画像・行列データ構造の提供、配列操作、図形描画、XMLおよびYAML入出力、コマンドラインパーサー、ユーティリティ機能など
imgproc opencv_imgproc300.lib フィルター処理、アフィン変換、エッジ検出、ハフ検出、色変換、ヒストグラム計算、ラベリングなど
calib3d opencv_calib3d300.lib カメラキャリブレーション、ステレオ対応点探索
features2d opencv_features2d300.lib 特徴点抽出(ORB、BRISK、FREAKなど)
highgui opencv_highgui2d300.lib GUI(ウィンドウ表示、画像ファイル、動画ファイルの入出力、カメラキャプチャなど)
ml opencv_ml300.lib SVM、決定木、ブースティング、ニューラルネットワークなど
cuda opencv_cuda300.lib 画像処理のCUDA(GPGPU)実装
objdetect opencv_objdetect300.lib オブジェクト検出(顔検出、人体検出など)
photo opencv_photo300.lib 画像修復、ノイズ除去処理、HDR(High Dynamic Range)合成、画像合成など
shape opencv_shape300.lib 形状マッチング
stitching opencv_stitching300.lib パノラマ合成
superres opencv_superres300.lib 超解像処理
video opencv_video300.lib オプティカルフロー、カルマンフィルタ、背景差分など
viz opencv_viz300.lib 3Dデータの可視化(内部的にVTKを使用)
nonfree opencv_nonfree300.lib 一部の国で特許が取得されている、もしくは使用に制限がある可能性があるアルゴリズム(SIFT、SURF)

ネット検索で情報を集めようとすると、断片ばかりが集まって、なかなかこういう全体像にたどり着けなくて苦しい思いをする。
初めて見た記事のサンプルコードがバージョン1.x系だったりすると、後々悲惨。


スポンサーリンク

関連記事

  • Faster R-CNN:ディープラーニングによる一般物体検出手法
  • 機械学習で遊ぶ
  • Arduinoで人感センサーを使う
  • Pythonのソースコードに特化した検索エンジン『Nullege』
  • OpenMVS:Multi-View Stereoによる3次元復元ライブラリ
  • Quartus II
  • R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
  • 顔追跡による擬似3D表示『Dynamic Perspective』
  • MLDemos:機械学習について理解するための可視化ツール
  • Polyscope:3Dデータ操作用GUIライブラリ
  • Raspberry Pi
  • OpenCV 3.1から追加されたSfMモジュール
  • NeRF (Neural Radiance Fields):深層学習による未知視点合成
  • Autodesk Mementoでゴジラを3次元復元する
  • MeshLab:3Dオブジェクトの確認・変換に便利なフリーウェア
  • Alice Vision:オープンソースのPhotogrammetryフレームワーク
  • OpenMVSのサンプルを動かしてみる
  • Unityの各コンポーネント間でのやり取り
  • ManuelBastioniLAB:人体モデリングできるBlenderアドオン
  • ニューラルネットワークで画像分類
  • WinSCP
  • オープンソースのプリント基板設計ツール『KiCad』
  • RefineNet (Multi-Path Refinement Network):ディープラーニン...
  • タイミングとクオリティ
  • ブログをGoogle App EngineからAmazon EC2へ移行
  • ヒーローに変身なりきりアーケードゲーム『ナレルンダー』
  • OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる
  • NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
  • COLMAP:オープンソースのSfM・MVSツール
  • OpenCVで顔のランドマークを検出する『Facemark API』
  • iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』
  • WordPressの表示を高速化する
  • trimesh:PythonでポリゴンMeshを扱うライブラリ
  • iPhoneで3D写真が撮れるアプリ『seene』
  • OpenVDB:3Dボリュームデータ処理ライブラリ
  • Mayaのレンダリング アトリビュート
  • Amazon Web ServicesでWordPress
  • 1枚の画像からマテリアルを作成できる無料ツール『Materialize』
  • オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート
  • 池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』
  • 書籍『ROSプログラミング』
  • HD画質の無駄遣い その2
  • モバイルバージョンを終了