takminさんが機械学習・画像認識の便利ツールを公開しています

コンピュータビジョン勉強会@関東の主催者の1人でお馴染みの@takminさんが機械学習による画像認識関連の便利ツールを2つ公開されています。↓
画像認識用Data Augmentationツールと物体検出評価ツールを自作した:takminの書きっぱなし備忘録


スポンサーリンク

オイラ、あんまり機械学習の常識を知らないんだけど、画像認識系だと、学習データを加工して増やすっていうテクニックが常套手段なのね。

Deep Convolutional Neural Networkとかで画像を学習させる際、学習画像をずらしたりぼかしたり、色々と変形を加えて学習画像を増やすことで、認識をロバストにするというテクニックが良く使われています。(Caffeなんかにも実装されている。)


スポンサーリンク

で、今回@takminさんがが公開したのは、学習データにそういう加工を良い感じに加えて増やしてくれるData Augmentationツールと、物体認識の競技会であるPASCAL VOCの評価方法をMatlabではなくコマンドラインから使えるようにした一般物体検出評価ツール

これって、ガチで機械学習かけて検出精度を競っている人達にしか見えない世界かも。オイラは@takminさんが公開している資料を見てちょっとずつ勉強しているのです。


スポンサーリンク

関連記事

OpenCVベースのマーカーARライブラリ『OpenAR』
MeshroomでPhotogrammetry
オープンソースの顔の動作解析ツールキット『OpenFace』
PCA (主成分分析)
openMVGをWindows10 Visual Studio 2015環境でビルドする
オープンソースのSLAMライブラリ『Cartographer』
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
OpenCV
統計的な顔モデル
Fast R-CNN:ディープラーニングによる一般物体検出手法
OpenCV バージョン4がリリースされた!
OpenCV 3.1のsfmモジュールを試す
CycleGAN:ドメイン関係を学習した画像変換
Deep Fluids:流体シミュレーションをディープラーニングで近似する
COLMAP:オープンソースのSfM・MVSツール
Open3D:3Dデータ処理ライブラリ
Autodesk Mementoでゴジラを3次元復元する
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
GAN (Generative Adversarial Networks):敵対的生成ネットワーク
OpenCVの超解像(SuperResolution)モジュールを試す
AR (Augmented Reality)とDR (Diminished Reality)
OpenCVのための軽量GUIライブラリ『cvui』
GoogleのDeep Learning論文
SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
PyTorch3D:3Dコンピュータービジョンライブラリ
U-Net:ディープラーニングによるSemantic Segmentation手法
OpenCVの超解像処理モジュール『Super Resolution』
hloc:SuperGlueで精度を向上させたSfM実装
FCN (Fully Convolutional Network):ディープラーニングによるSema...
機械学習について理解するための可視化ツール『MLDemos』
2D→3D復元技術で使われる用語まとめ
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』
OpenCV 3.3.0-RCでsfmモジュールをビルド
Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ
SSII 2014 デモンストレーションセッションのダイジェスト動画
ArUco:OpenCVベースのコンパクトなARライブラリ
続・ディープラーニングの資料
機械学習について最近知った情報

コメント