takminさんが機械学習・画像認識の便利ツールを公開しています

コンピュータビジョン勉強会@関東の主催者の1人でお馴染みの@takminさんが機械学習による画像認識関連の便利ツールを2つ公開されています。↓
画像認識用Data Augmentationツールと物体検出評価ツールを自作した:takminの書きっぱなし備忘録


スポンサーリンク

オイラ、あんまり機械学習の常識を知らないんだけど、画像認識系だと、学習データを加工して増やすっていうテクニックが常套手段なのね。

Deep Convolutional Neural Networkとかで画像を学習させる際、学習画像をずらしたりぼかしたり、色々と変形を加えて学習画像を増やすことで、認識をロバストにするというテクニックが良く使われています。(Caffeなんかにも実装されている。)


スポンサーリンク

で、今回@takminさんがが公開したのは、学習データにそういう加工を良い感じに加えて増やしてくれるData Augmentationツールと、物体認識の競技会であるPASCAL VOCの評価方法をMatlabではなくコマンドラインから使えるようにした一般物体検出評価ツール

これって、ガチで機械学習かけて検出精度を競っている人達にしか見えない世界かも。オイラは@takminさんが公開している資料を見てちょっとずつ勉強しているのです。


スポンサーリンク

関連記事

BGSLibrary:OpenCVベースの背景差分ライブラリ
OpenCVのバージョン3が正式リリースされたぞ
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
3D復元技術の情報リンク集
第1回 3D勉強会@関東『SLAMチュートリアル大会』
Adobe MAX 2015
ManimML:機械学習の概念を視覚的に説明するためのライブラリ
UnityでOpenCVを使うには?
ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
RefineNet (Multi-Path Refinement Network):ディープラーニン...
iOSで使えるJetpac社の物体認識SDK『DeepBelief』
Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
OpenCV
顔画像処理技術の過去の研究
2D→3D復元技術で使われる用語まとめ
OpenMVSのサンプルを動かしてみる
書籍『OpenCV 3 プログラミングブック』を購入
Mitsuba 2:オープンソースの物理ベースレンダラ
ベイズ推定とグラフィカルモデル
Structure from Motion (多視点画像からの3次元形状復元)
iPhoneで3D写真が撮れるアプリ『seene』
データサイエンティストって何だ?
Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ
SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
Kinect for Windows V2のプレオーダー開始
OpenCV 3.1のsfmモジュールのビルド再び
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
Kaolin:3Dディープラーニング用のPyTorchライブラリ
Qlone:スマホのカメラで3Dスキャンできるアプリ
OpenCVで平均顔を作るチュートリアル
OpenCVの顔検出過程を可視化した動画
続・ディープラーニングの資料
OpenCVで顔のモーフィングを実装する
SegNet:ディープラーニングによるSemantic Segmentation手法
機械学習に役立つPythonライブラリ一覧
全脳アーキテクチャ勉強会
Paul Debevec
CGのためのディープラーニング
Adobeの手振れ補正機能『ワープスタビライザー』の秘密
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
Pix2Pix:CGANによる画像変換

コメント