Build InsiderでOpenCV入門という連載が始まった。
OpenCVに触れたのは会社員になってからだった。それまでは画像処理でリアルタイムにこれほどの処理が可能だなんて思っていなかったな。
連載の第1回では概要が程よくまとまっていてわかりやすい。初めて触れた時にここまで俯瞰した情報に出会っていれば、もっと習得は早かったような気がする。自分が初学時に知りたかった情報を引用して抜粋。
OpenCVとは? その機能概要/構成技術/主要モジュール
1.2 OpenCVでできること
OpenCVを使うと利用できる機能のうち、比較的一般的にも知られている機能を以下にピックアップしました。また、この他、開発者自身が独自のアルゴリズムを実装するために用いることができる基本的な機能や、便利な機能も備えています。
スポンサーリンク
モジュール名 ライブラリ名(OpenCV 3.0) 概要 core opencv_core300.lib 画像・行列データ構造の提供、配列操作、図形描画、XMLおよびYAML入出力、コマンドラインパーサー、ユーティリティ機能など imgproc opencv_imgproc300 .lib フィルター処理、アフィン変換、エッジ検出、ハフ検出、色変換、ヒストグラム計算、ラベリングなど calib3d opencv_calib3d300 .lib カメラキャリブレーション、ステレオ対応点探索 features2d opencv_features2d 300.lib 特徴点抽出(ORB、BRISK、FREAKなど) highgui opencv_highgui2d 300.lib GUI(ウィンドウ表示、画像ファイル、動画ファイルの入出力、カメラキャプチャなど) ml opencv_ml300.lib SVM、決定木、ブースティング、ニューラルネットワークなど cuda opencv_cuda300.lib 画像処理のCUDA(GPGPU)実装 objdetect opencv_objdetect300 .lib オブジェクト検出(顔検出、人体検出など) photo opencv_photo300.lib 画像修復、ノイズ除去処理、HDR(High Dynamic Range)合成、画像合成など shape opencv_shape300.lib 形状マッチング stitching opencv_stitching300 .lib パノラマ合成 superres opencv_superres300 .lib 超解像処理 video opencv_video300.lib オプティカルフロー、カルマンフィルタ、背景差分など viz opencv_viz300.lib 3Dデータの可視化(内部的にVTKを使用) nonfree opencv_nonfree300 .lib 一部の国で特許が取得されている、もしくは使用に制限がある可能性があるアルゴリズム(SIFT、SURF)
ネット検索で情報を集めようとすると、断片ばかりが集まって、なかなかこういう全体像にたどり着けなくて苦しい思いをする。
初めて見た記事のサンプルコードがバージョン1.x系だったりすると、後々悲惨。
スポンサーリンク
関連記事
WordPressのサーバ引っ越し方法を考える
Google App Engine上のWordPressでAmazonJSを利用する
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
粘土をこねるようなスカルプトモデリング
Accord.NET Framework:C#で使える機械学習ライブラリ
OpenGVのライブラリ構成
NeRF (Neural Radiance Fields):深層学習による新規視点合成
Open Shading Language (OSL)
立体視を試してみた
libigl:軽量なジオメトリ処理ライブラリ
OpenCV 3.1のsfmモジュールのビルド再び
オープンソースのIT資産・ライセンス管理システム『Snipe-IT』
HD画質の無駄遣い
Blendify:コンピュータービジョン向けBlenderラッパー
MFnMeshクラスのsplit関数
書籍『OpenCV 3 プログラミングブック』を購入
Mayaのプラグイン開発
TorchStudio:PyTorchのための統合開発環境とエコシステム
ポリゴン用各種イテレータと関数セット
Mitsuba 3:オープンソースの研究向けレンダラ
Python for Unity:UnityEditorでPythonを使えるパッケージ
Math Inspector:科学計算向けビジュアルプログラミングツール
読みやすくて高速なディープラーニングのフレームワーク『Caffe』
Iterator
iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』
Python拡張モジュールのWindows用インストーラー配布サイト
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
CNN Explainer:畳み込みニューラルネットワーク可視化ツール
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
MB-Lab:Blenderの人体モデリングアドオン
Python.NET:Pythonと.NETを連携させるパッケージ
PythonでMayaのShapeノードプラグインを作る
3Dグラフィックスの入門書
OpenCVでPhotoshopのプラグイン開発
ニューラルネットワークと深層学習
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
ヒーローに変身なりきりアーケードゲーム『ナレルンダー』
海外ドラマのChromaKey
3Dモデルを立体視で確認できるVRアプリを作っている
Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』
PyDataTokyo主催のDeep Learning勉強会
Seleniumを使ったFXや株の自動取引
コメント
[…] ネガさんとこの記事のなかで、つい思い出したといえば、 OpenCV […]