書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

もう1年以上前になりますが、書籍イラストで学ぶ ディープラーニング」を購入して少しずつ読み進めていたのです。↓



ところが、読み進めている途中で壁にぶち当たりました。この書籍、途中からどんどん数式率が上がって行き、あんまりイラストで教えてくれなくなるんですよ(笑)

数式が苦手だから「イラストで学ぶ」に期待していたのですが、考えが甘かったようです。
載っているサンプルコードは各種Deep Learningライブラリの使い方なので、肝心の仕組みは当然隠蔽されていて、そこから仕組みを理解するのは難しい。(ライブラリの使い方を覚えられる分実践的なんだけどね)

なので、実装しながら仕組みを理解していく方針に切り替えることにした。
ということで、こちらの書籍に頼ることにしました↓ (すぐ書籍買っちゃう)

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

Pythonのサンプルコードと、書籍の正誤表はGitHubにある↓
https://github.com/oreilly-japan/deep-learning-from-scratch
https://github.com/oreilly-japan/deep-learning-from-scratch/wiki/errata

これでディープラーニングを作れる(笑)



書籍のサンプルコードはPythonですが、そこは慣れたUnity(というかC#)環境に置き換えて学ぼうと思い、PythonのNumPyに代わる数値計算ライブラリを探していたのでした。
Math.NET Numerics:Unityで使える数値計算ライブラリ
立て続けにUnityの話題ですが。数学的なことをUnityで勉強しようかなという気分になってきた。お勉強用途だと最近はPython、というかPythonのNumPyが手軽で良く使われてるイメージ。Unityでも使える数値計算ライブラリが無い...


で、Math.NET Numerics導入後に少し調べたら、似た発想の人がいた↓
http://tnakamura.hatenablog.com/entry/2016/12/05/perceptron
http://tnakamura.hatenablog.com/entry/2016/12/08/sigmoid-relu-softmax
http://tnakamura.hatenablog.com/entry/2016/12/15/mnist
http://tnakamura.hatenablog.com/entry/2016/12/16/three-layer-neural-network
http://tnakamura.hatenablog.com/entry/2017/01/30/loss-function
http://tnakamura.hatenablog.com/entry/2017/02/08/numerical-differentiation
http://tnakamura.hatenablog.com/entry/2017/02/10/numeric-gradient
http://tnakamura.hatenablog.com/entry/2017/02/15/gradient-descent
http://tnakamura.hatenablog.com/entry/2017/02/20/gradient-simplenet
https://github.com/snaga/DeepLearning_C_Sharp

せっかくなので実装の参考にさせていただこう。Math.NET Numericsの使い方を知るのに良いサンプルだ。
Unity上で動作の仕組みを可視化できたら最高なんだが、そこまで行けるだろうか。

2019年 追記:今ならMath.NET Numericsじゃなくて、このNumSharpを使った方が良いと思う↓
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
C#で書かれたNumPy風の数値計算ライブラリ。Apache License 2.0だそうです。NumSharpNumSharpは.NET StandardをターゲットとしたNumPyのC#ポートです。NumSharpはC#で科学計算を行う...

パーセプトロン、ニューラルネットワークのイメージ

書籍とは関係ないけど、パーセプトロン、ニューラルネットワークの働きをビジュアル化するとこんなイメージらしい↓



色んなアルゴリズムをこんな感じで可視化できると理解が捗るだろうなぁ。

関連記事

ROSの薄い本

uvでWindows11のPython環境を管理する

IronPythonを使ってUnity上でPythonのコードを実行する

Mean Stack開発の最初の一歩

海外ドラマのChromaKey

CGALDotNet:計算幾何学ライブラリ CGALのC#ラッパー

Kubric:機械学習用アノテーション付き動画生成パイプライン

Deep Fluids:流体シミュレーションをディープラーニングで近似する

Mitsuba 2:オープンソースの物理ベースレンダラ

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

hloc:SuperGlueで精度を向上させたSfM・Visual Localization

OpenSfM:PythonのStructure from Motionライブラリ

Amazon Web ServicesでWordPress

Rerun:マルチモーダルデータの可視化アプリとSDK

書籍『開田裕治 怪獣イラストテクニック』

Seleniumを使ったFXや株の自動取引

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

データサイエンティストって何だ?

cvui:OpenCVのための軽量GUIライブラリ

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

Gource:バージョン管理の履歴を可視化するツール

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

SONY製のニューラルネットワークライブラリ『NNabla』

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

PGGAN:段階的に解像度を上げて学習を進めるGAN

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

Leap MotionでMaya上のオブジェクトを操作できるプラグイン

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Google Colaboratoryで遊ぶ準備

Webスクレイピングの勉強会に行ってきた

python-twitterで自分のお気に入りを取得する

PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...

プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)

OpenCVで顔のランドマークを検出する『Facemark API』

OpenCV バージョン4がリリースされた!

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

UnityでARKit2.0

SVM (Support Vector Machine)

Managing Software Requirements: A Unified Approach

統計的な顔モデル

コメント