takminさんが機械学習・画像認識の便利ツールを公開しています

コンピュータビジョン勉強会@関東の主催者の1人でお馴染みの@takminさんが機械学習による画像認識関連の便利ツールを2つ公開されています。↓
画像認識用Data Augmentationツールと物体検出評価ツールを自作した:takminの書きっぱなし備忘録


スポンサーリンク

オイラ、あんまり機械学習の常識を知らないんだけど、画像認識系だと、学習データを加工して増やすっていうテクニックが常套手段なのね。

Deep Convolutional Neural Networkとかで画像を学習させる際、学習画像をずらしたりぼかしたり、色々と変形を加えて学習画像を増やすことで、認識をロバストにするというテクニックが良く使われています。(Caffeなんかにも実装されている。)


スポンサーリンク

で、今回@takminさんがが公開したのは、学習データにそういう加工を良い感じに加えて増やしてくれるData Augmentationツールと、物体認識の競技会であるPASCAL VOCの評価方法をMatlabではなくコマンドラインから使えるようにした一般物体検出評価ツール

これって、ガチで機械学習かけて検出精度を競っている人達にしか見えない世界かも。オイラは@takminさんが公開している資料を見てちょっとずつ勉強しているのです。


スポンサーリンク

関連記事

pythonの機械学習ライブラリ『scikit-learn』
ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
OpenGVのライブラリ構成
OpenCV3.3.0でsfmモジュールのビルドに成功!
UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン
OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
ArUco:OpenCVベースのコンパクトなARライブラリ
Leap MotionでMaya上のオブジェクトを操作できるプラグイン
オープンソースの顔認識フレームワーク『OpenBR』
写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
ディープラーニング
OpenCV 3.1のsfmモジュールを試す
OpenCVベースの背景差分ライブラリ『BGSLibrary』
AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う
写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』
UnityでOpenCVを使うには?
Kaolin:3Dディープラーニング用のPyTorchライブラリ
オープンソースのStructure from Motionツール『Regard3D』
C#で使える機械学習ライブラリ『Accord.NET Framework』
OpenCVでiPhone6sのカメラをキャリブレーションする
統計的な顔モデル
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
Structure from Motion (多視点画像からの3次元形状復元)
Open3D:3Dデータ処理ライブラリ
Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
hloc:SuperGlueで精度を向上させたSfM実装
全脳アーキテクチャ勉強会
Kinect for Windows V2のプレオーダー開始
OpenCV 3.3.0-RCでsfmモジュールをビルド
第1回 3D勉強会@関東『SLAMチュートリアル大会』
機械学習について最近知った情報
AR (Augmented Reality)とDR (Diminished Reality)
PCA (主成分分析)
SegNet:ディープラーニングによるSemantic Segmentation手法
複数画像から3次元形状を再構築するライブラリ『Multi-View Environment』
SSII 2014 デモンストレーションセッションのダイジェスト動画
AfterEffectsプラグイン開発
TensorFlowでCGを微分できる『TensorFlow Graphics』
データサイエンティストって何だ?

コメント