takminさんが機械学習・画像認識の便利ツールを公開しています

コンピュータビジョン勉強会@関東の主催者の1人でお馴染みの@takminさんが機械学習による画像認識関連の便利ツールを2つ公開されています。↓
画像認識用Data Augmentationツールと物体検出評価ツールを自作した:takminの書きっぱなし備忘録


スポンサーリンク

オイラ、あんまり機械学習の常識を知らないんだけど、画像認識系だと、学習データを加工して増やすっていうテクニックが常套手段なのね。

Deep Convolutional Neural Networkとかで画像を学習させる際、学習画像をずらしたりぼかしたり、色々と変形を加えて学習画像を増やすことで、認識をロバストにするというテクニックが良く使われています。(Caffeなんかにも実装されている。)


スポンサーリンク

で、今回@takminさんがが公開したのは、学習データにそういう加工を良い感じに加えて増やしてくれるData Augmentationツールと、物体認識の競技会であるPASCAL VOCの評価方法をMatlabではなくコマンドラインから使えるようにした一般物体検出評価ツール

これって、ガチで機械学習かけて検出精度を競っている人達にしか見えない世界かも。オイラは@takminさんが公開している資料を見てちょっとずつ勉強しているのです。


スポンサーリンク

関連記事

オープンソースの顔の動作解析ツールキット『OpenFace』
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』
ニューラルネットワークと深層学習
OpenCVの三角測量関数『cv::triangulatepoints』
手を動かしながら学ぶデータマイニング
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
Windows10でPyTorchをインストールしてVSCodeで使う
読みやすくて高速なディープラーニングのフレームワーク『Caffe』
第1回 3D勉強会@関東『SLAMチュートリアル大会』
Dlib:C++の機械学習ライブラリ
CGのためのディープラーニング
iPhoneで3D写真が撮れるアプリ『seene』
疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...
openMVGをWindows10 Visual Studio 2015環境でビルドする
hloc:SuperGlueで精度を向上させたSfM実装
.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
AfterEffectsプラグイン開発
Kinect for Windows V2のプレオーダー開始
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
BGSLibrary:OpenCVベースの背景差分ライブラリ
FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う
データサイエンティストって何だ?
OpenAR:OpenCVベースのマーカーARライブラリ
OpenCV
CycleGAN:ドメイン関係を学習した画像変換
OpenGVのライブラリ構成
SVM (Support Vector Machine)
人間の顔をそっくりそのままCGで復元する『Digital Emily Project』
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
Fast R-CNN:ディープラーニングによる一般物体検出手法
スクラッチで既存のキャラクターを立体化したい
Pix2Pix:CGANによる画像変換
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
SDカードサイズのコンピューター『Intel Edison』
3D復元技術の情報リンク集
OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ
OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク
Runway ML:クリエイターのための機械学習ツール

コメント