takminさんが機械学習・画像認識の便利ツールを公開しています

コンピュータビジョン勉強会@関東の主催者の1人でお馴染みの@takminさんが機械学習による画像認識関連の便利ツールを2つ公開されています。↓
画像認識用Data Augmentationツールと物体検出評価ツールを自作した:takminの書きっぱなし備忘録


スポンサーリンク

オイラ、あんまり機械学習の常識を知らないんだけど、画像認識系だと、学習データを加工して増やすっていうテクニックが常套手段なのね。

Deep Convolutional Neural Networkとかで画像を学習させる際、学習画像をずらしたりぼかしたり、色々と変形を加えて学習画像を増やすことで、認識をロバストにするというテクニックが良く使われています。(Caffeなんかにも実装されている。)


スポンサーリンク

で、今回@takminさんがが公開したのは、学習データにそういう加工を良い感じに加えて増やしてくれるData Augmentationツールと、物体認識の競技会であるPASCAL VOCの評価方法をMatlabではなくコマンドラインから使えるようにした一般物体検出評価ツール

これって、ガチで機械学習かけて検出精度を競っている人達にしか見えない世界かも。オイラは@takminさんが公開している資料を見てちょっとずつ勉強しているのです。


スポンサーリンク

関連記事

オープンソースの顔の動作解析ツールキット『OpenFace』
C#で使える可読性重視のディープラーニングライブラリ『KelpNet』
PythonのStructure from Motionライブラリ『OpenSfM』
複数視点画像から3次元形状を復元するライブラリ『openMVG』
手を動かしながら学ぶデータマイニング
Google Colaboratoryで遊ぶ準備
PyDataTokyo主催のDeep Learning勉強会
Adobeの手振れ補正機能『ワープスタビライザー』の秘密
SSII2014 チュートリアル講演会の資料
AfterEffectsプラグイン開発
機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...
機械学習で流体シミュレーションを近似する『Physics Forests』
OpenCVで動画の手ぶれ補正
統計的な顔モデル
Active Appearance Models(AAM)
OpenGVのライブラリ構成
PyTorch3D:3Dコンピュータービジョンライブラリ
ディープラーニング
Kinect for Windows v2の日本価格決定
OpenCVの三角測量関数『cv::triangulatepoints』
全脳アーキテクチャ勉強会
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う
OpenCVの超解像処理モジュール『Super Resolution』
YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
FCN (Fully Convolutional Network):ディープラーニングによるSema...
fSpy:1枚の写真からカメラパラメーターを割り出すツール
Leap MotionでMaya上のオブジェクトを操作できるプラグイン
FacebookがDeep learningツールの一部をオープンソース化
写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』
Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
データサイエンティストって何だ?
畳み込みニューラルネットワーク (CNN:Convolutional Neural Network)
OpenCVのバージョン3が正式リリースされたぞ
UnityでOpenCVを使うには?
OpenGVの用語
スマホのカメラで3Dスキャンできるアプリ『Qlone』
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』
Windows10でPyTorchをインストールしてVSCodeで使う
GAN (Generative Adversarial Networks):敵対的生成ネットワーク

コメント