サイトアイコン NegativeMindException

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

もう1年以上前になりますが、書籍イラストで学ぶ ディープラーニング」を購入して少しずつ読み進めていたのです。↓



ところが、読み進めている途中で壁にぶち当たりました。この書籍、途中からどんどん数式率が上がって行き、あんまりイラストで教えてくれなくなるんですよ(笑)

数式が苦手だから「イラストで学ぶ」に期待していたのですが、考えが甘かったようです。
載っているサンプルコードは各種Deep Learningライブラリの使い方なので、肝心の仕組みは当然隠蔽されていて、そこから仕組みを理解するのは難しい。(ライブラリの使い方を覚えられる分実践的なんだけどね)

なので、実装しながら仕組みを理解していく方針に切り替えることにした。
ということで、こちらの書籍に頼ることにしました↓ (すぐ書籍買っちゃう)



Pythonのサンプルコードと、書籍の正誤表はGitHubにある↓
https://github.com/oreilly-japan/deep-learning-from-scratch
https://github.com/oreilly-japan/deep-learning-from-scratch/wiki/errata

これでディープラーニングを作れる(笑)



書籍のサンプルコードはPythonですが、そこは慣れたUnity(というかC#)環境に置き換えて学ぼうと思い、PythonのNumPyに代わる数値計算ライブラリを探していたのでした。
Math.NET Numerics:Unityで使える数値計算ライブラリ
立て続けにUnityの話題ですが。数学的なことをUnityで勉強しようかなという気分になってきた。お勉強用途だと最近はPython、というかPythonのNumPyが手軽で良く使われてるイメージ。Unityでも使える数値計算ライブラリが無い...


で、Math.NET Numerics導入後に少し調べたら、似た発想の人がいた↓
http://tnakamura.hatenablog.com/entry/2016/12/05/perceptron
http://tnakamura.hatenablog.com/entry/2016/12/08/sigmoid-relu-softmax
http://tnakamura.hatenablog.com/entry/2016/12/15/mnist
http://tnakamura.hatenablog.com/entry/2016/12/16/three-layer-neural-network
http://tnakamura.hatenablog.com/entry/2017/01/30/loss-function
http://tnakamura.hatenablog.com/entry/2017/02/08/numerical-differentiation
http://tnakamura.hatenablog.com/entry/2017/02/10/numeric-gradient
http://tnakamura.hatenablog.com/entry/2017/02/15/gradient-descent
http://tnakamura.hatenablog.com/entry/2017/02/20/gradient-simplenet
https://github.com/snaga/DeepLearning_C_Sharp

せっかくなので実装の参考にさせていただこう。Math.NET Numericsの使い方を知るのに良いサンプルだ。
Unity上で動作の仕組みを可視化できたら最高なんだが、そこまで行けるだろうか。

2019年 追記:今ならMath.NET Numericsじゃなくて、このNumSharpを使った方が良いと思う↓
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
C#で書かれたNumPy風の数値計算ライブラリ。Apache License 2.0だそうです。NumSharpNumSharpは.NET StandardをターゲットとしたNumPyのC#ポートです。NumSharpはC#で科学計算を行う...


スポンサーリンク

パーセプトロン、ニューラルネットワークのイメージ

書籍とは関係ないけど、パーセプトロン、ニューラルネットワークの働きをビジュアル化するとこんなイメージらしい↓



色んなアルゴリズムをこんな感じで可視化できると理解が捗るだろうなぁ。


スポンサーリンク

関連記事

  • 画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...
  • CycleGAN:ドメイン関係を学習した画像変換
  • 3Dグラフィックスの入門書
  • UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン
  • Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方
  • OpenMesh:オープンソースの3Dメッシュデータライブラリ
  • Google Colaboratoryで遊ぶ準備
  • ZScript
  • Blendify:コンピュータービジョン向けBlenderラッパー
  • Russian3DScannerのトポロジー転送ツール『WrapX』
  • DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
  • cvui:OpenCVのための軽量GUIライブラリ
  • Deep Learningとその他の機械学習手法の性能比較
  • Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
  • Unity ARKitプラグインサンプルのチュートリアルを読む
  • Netron:機械学習モデルを可視化するツール
  • Polyscope:3Dデータ操作用GUIライブラリ
  • オープンソースの顔認識フレームワーク『OpenBR』
  • すてる英語学習本『ずるいえいご』
  • 機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...
  • Iridescence:プロトタイピング向け軽量3D可視化ライブラリ
  • Houdiniのライセンスの種類
  • 3DCG Meetup #4に行ってきた
  • OpenCVでiPhone6sのカメラをキャリブレーションする
  • pythonの機械学習ライブラリ『scikit-learn』
  • UnityからROSを利用できる『ROS#』
  • 統計的な顔モデル
  • 書籍『ジ・アート・オブ・シン・ゴジラ』の発売日が2016年12月30日(金)に決定
  • Raspberry Piでセンサーの常時稼働を検討する
  • OANDAのfxTrade API
  • R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
  • Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
  • Fast R-CNN:ディープラーニングによる一般物体検出手法
  • OpenCVで平均顔を作るチュートリアル
  • ブログが1日ダウンしてました
  • OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
  • TorchStudio:PyTorchのための統合開発環境とエコシステム
  • Google App EngineでWordPress
  • Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
  • OpenCVで顔のランドマークを検出する『Facemark API』
  • UnityプロジェクトをGitHubで管理する
  • Geogram:C++の3D幾何アルゴリズムライブラリ
  • モバイルバージョンを終了