書籍『イラストで学ぶ ディープラーニング』

Pylearn2, Caffeと来て、Chainer, TensorFlowと、ディープラーニング系のライブラリが乱立し過ぎて、ある時点から追いかけるのをやめておりました。そもそももう少し仕組みというか、特性を理解しないと活用もできないんだよなぁ、と。

と思いつつ、自分のレベルに合った簡単な情報がなかなかなくて半ば諦めていたところ、程良い感じの入門書が発売された。↓

イラストで学ぶ ディープラーニング (KS情報科学専門書)

ディープラーニングをはじめて学びたい人を対象とした入門書です。

  • カラー図版で、畳み込みニューラルネットワークなどの基礎的な手法が直感的に理解できます。
  • CaffeやPylearn2などの主要ツールのインストール方法や活用事例を紹介しています。
  • 新たなツールとして最も注目されているChainerやTensorFlowのインストール方法や活用事例も紹介しています。

やっぱイラストですよね。



これならオイラでも挫折せずに最後まで読めそう。以下、本書の目次。

第1章 序論
ディープラーニングとは/注目のきっかけ/なぜディープラーニングなのか/何がディープラーニングなのか

第2章 ニューラルネットワーク
ニューラルネットワークの歴史/マカロック{ピッツの素子モデル/パーセプトロン/多層パーセプトロン/誤差逆伝播法/誤差関数と活性化関数/尤度関数/確率的勾配降下法/学習係数

第3章 畳み込みニューラルネットワーク
畳み込みニューラルネットワークの構成/畳み込み層/プーリング層/全結合層/出力層/ネットワークの学習方法

第4章 制約ボルツマンマシン
ホップフィールドネットワーク/ボルツマンマシン/制約ボルツマンマシン/コントラスティブ・ダイバージェンス/ディープ・ビリーフ・ネットワーク

第5章 オートエンコーダ
オートエンコーダ/デノイジング・オートエンコーダ/スパース・オートエンコーダ/スタックド・オートエンコーダ/事前学習への利用

第6章 汎化性能を向上させる方法
学習サンプル/前処理/活性化関数/ドロップアウト/ドロップコネクト

第7章 ディープラーニングのツール
ディープラーニングの開発環境/
Theano/Pylearn2/Caffe/DIGITS/Chainer/TensorFlow

第8章 ディープラーニングの現在・未来
ディープラーニングの実用事例/ディープラーニングの先に

自分の知的レベルに合った教材を選ぶって結構重要なことだと思います。背伸びするのも悪くないけど、挫折しやすいのでよほど精神力のある人以外あんまりやらない方が良い気がする。

関連記事

Fast R-CNN:ディープラーニングによる一般物体検出手法

PGGAN:段階的に解像度を上げて学習を進めるGAN

Live CV:インタラクティブにComputer Visionコーディングができるツール

PyDataTokyo主催のDeep Learning勉強会

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

OpenCV 3.3.0-RCでsfmモジュールをビルド

Paul Debevec

Mitsuba 3:オープンソースの研究向けレンダラ

openMVGをWindows10 Visual Studio 2015環境でビルドする

エニアグラム

続・ディープラーニングの資料

Managing Software Requirements: A Unified Approach

OpenSfM:PythonのStructure from Motionライブラリ

GoogleのDeep Learning論文

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

CGのためのディープラーニング

書籍『GODZILLA GRAPHIC COLLECTION ゴジラ造型写真集』が出るぞ

それぞれの媒質の屈折率

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

Autodesk Mementoでゴジラを3次元復元する

東京オリンピックと案内表示

Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ

機械学習での「回帰」とは?

深海魚

MeshroomでPhotogrammetry

書籍『開田裕治 怪獣イラストテクニック』

Windows10でPyTorchをインストールしてVSCodeで使う

Facebookの顔認証技術『DeepFace』

PyTorch3D:3Dコンピュータービジョンライブラリ

ニューラルネットワークと深層学習

C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』

MVStudio:オープンソースのPhotogrammetryツール

OpenAR:OpenCVベースのマーカーARライブラリ

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

コメント