もう1年以上前になりますが、書籍「イラストで学ぶ ディープラーニング」を購入して少しずつ読み進めていたのです。↓

ところが、読み進めている途中で壁にぶち当たりました。この書籍、途中からどんどん数式率が上がって行き、あんまりイラストで教えてくれなくなるんですよ(笑)
数式が苦手だから「イラストで学ぶ」に期待していたのですが、考えが甘かったようです。
載っているサンプルコードは各種Deep Learningライブラリの使い方なので、肝心の仕組みは当然隠蔽されていて、そこから仕組みを理解するのは難しい。(ライブラリの使い方を覚えられる分実践的なんだけどね)
なので、実装しながら仕組みを理解していく方針に切り替えることにした。
ということで、こちらの書籍に頼ることにしました↓ (すぐ書籍買っちゃう)

Pythonのサンプルコードと、書籍の正誤表はGitHubにある↓
https://github.com/oreilly-japan/deep-learning-from-scratch
https://github.com/oreilly-japan/deep-learning-from-scratch/wiki/errata
これでディープラーニングを作れる(笑)
書籍のサンプルコードはPythonですが、そこは慣れたUnity(というかC#)環境に置き換えて学ぼうと思い、PythonのNumPyに代わる数値計算ライブラリを探していたのでした。

で、Math.NET Numerics導入後に少し調べたら、似た発想の人がいた↓
http://tnakamura.hatenablog.com/entry/2016/12/05/perceptron
http://tnakamura.hatenablog.com/entry/2016/12/08/sigmoid-relu-softmax
http://tnakamura.hatenablog.com/entry/2016/12/15/mnist
http://tnakamura.hatenablog.com/entry/2016/12/16/three-layer-neural-network
http://tnakamura.hatenablog.com/entry/2017/01/30/loss-function
http://tnakamura.hatenablog.com/entry/2017/02/08/numerical-differentiation
http://tnakamura.hatenablog.com/entry/2017/02/10/numeric-gradient
http://tnakamura.hatenablog.com/entry/2017/02/15/gradient-descent
http://tnakamura.hatenablog.com/entry/2017/02/20/gradient-simplenet
https://github.com/snaga/DeepLearning_C_Sharp
せっかくなので実装の参考にさせていただこう。Math.NET Numericsの使い方を知るのに良いサンプルだ。
Unity上で動作の仕組みを可視化できたら最高なんだが、そこまで行けるだろうか。
2019年 追記:今ならMath.NET Numericsじゃなくて、このNumSharpを使った方が良いと思う↓

パーセプトロン、ニューラルネットワークのイメージ
書籍とは関係ないけど、パーセプトロン、ニューラルネットワークの働きをビジュアル化するとこんなイメージらしい↓
色んなアルゴリズムをこんな感じで可視化できると理解が捗るだろうなぁ。
関連記事
OpenCV 3.1から追加されたSfMモジュール
2D→3D復元技術で使われる用語まとめ
書籍『ROSプログラミング』
ZBrushで作った3Dモデルを立体視で確認できるVRアプリ...
プロシージャル手法に特化した本が出てるみたい(まだ買わないけ...
Web経由でRaspberry PiのGPIOを操作したい
それぞれの媒質の屈折率
Regard3D:オープンソースのStructure fro...
OpenCVのfindEssentialMat関数を使ったサ...
Dlib:C++の機械学習ライブラリ
PythonでBlenderのAdd-on開発
Deep Fluids:流体シミュレーションをディープラーニ...
DensePose:画像中の人物表面のUV座標を推定する
UnityのuGUIチュートリアル
OpenCVの三角測量関数『cv::triangulatep...
書籍『天才を殺す凡人』読了
Transformer Explainer:テキスト生成モデ...
bpy-renderer:レンダリング用Pythonパッケー...
MVStudio:オープンソースのPhotogrammetr...
konashiのサンプルコードを動かしてみた
HD画質の無駄遣い
第25回コンピュータビジョン勉強会@関東に行って来た
UnityのGameObjectの向きをScriptで制御す...
書籍『具体と抽象』読了
Russian3DScannerのトポロジー転送ツール『Wr...
Googleが画像解析旅行ガイドアプリのJetpac社を買収
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
UnrealCLR:Unreal Engineで.NET C...
Deep Learningとその他の機械学習手法の性能比較
ブログをGoogle App EngineからAmazon ...
オープンソースの取引プラットフォーム
統計的な顔モデル
Open3D:3Dデータ処理ライブラリ
組み込み向けのWindows OS 『Windows Emb...
Amazon EC2ログイン用の秘密鍵を無くした場合の対処方...
PGGAN:段階的に解像度を上げて学習を進めるGAN
Raspberry Pi 2のGPIOピン配置
OpenCV 3.3.0-RCでsfmモジュールをビルド
書籍『人生は、運よりも実力よりも「勘違いさせる力」で決まって...
Runway ML:クリエイターのための機械学習ツール
PCA (主成分分析)
Active Appearance Models(AAM)


コメント