KelpNet:C#で使える可読性重視のディープラーニングライブラリ

ここ最近、ディープラーニングというか、ニューラルネットワークのお勉強をしてみて、その処理コストが高いため、実装では行列演算として扱われていることを知った。


畳み込みニューラルネットワーク (CNN: Convolutional Neural Network)
例の書籍「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」を一通り読み終わりました。「あえてPythonを使わずにUnity C#で実装しながら勉強する」とか言っておきながら、結局途中でコーディン...


行列演算に最適化されたライブラリを使うことで処理の高速化を図っているらしい。(GPUも行列演算得意だしね)

そういうわけで、巷のオープンソースコードからアルゴリズムを勉強するのは、数学(というか行列)に疎いとちょっとしんどかったりする。



そんな数学の苦手な人でもコードを読んで勉強できるよう、春条氏が行列演算を使わずにディープラーニングを実装したライブラリKelpNetを公開している。

KelpNet

KelpNetはC#で実装された深層学習のライブラリです。

特徴

  • 行列演算をライブラリに頼らないため全ソースが可読になっており、どこで何をしているかを全て観測できます
  • KerasやChainerが採用している、関数を積み重ねるように記述するコーディングスタイルを採用しています
  • 並列演算にOpenCLを採用しているため、GPUだけでなくCPUやFPGA等の様々な演算装置で処理を並列化できます

C#で作られているメリット

  • 開発環境の構築が容易で、プログラミング初学者にも学びやすい言語です
  • WindowsFormやUnity等、処理結果を視覚的に表示するための選択肢が豊富です
  • PCや携帯、組み込み機器等、様々なプラットフォームに向けたアプリケーションの開発ができます

このライブラリについて

このライブラリの基幹部分はChainerを参考に実装されています。 その為ほとんどの関数パラメータがChainerと同じになっており、Chainer向けのサンプルを参考に開発することが可能になっています。

License



Unityでの利用も想定されているようなので、ちょっと試してみたいな。

2018年8月 追記:じんべえざめさんがKelpNetを使った学習記事を公開している↓
https://jinbeizame.hateblo.jp/entry/kelpnet_intro
https://jinbeizame.hateblo.jp/entry/kelpnet_xor
https://jinbeizame.hateblo.jp/entry/kelpnet_opencl_gpu
https://jinbeizame.hateblo.jp/entry/kelpnet_cnn
https://jinbeizame.hateblo.jp/entry/kelpnet_vgg
https://jinbeizame.hateblo.jp/entry/kelpnet_transfer

2019年3月 追記:KelpNetをUnityで使うQiita記事↓
https://qiita.com/yanosen_jp/items/4ca7d16908f0956ef7d8

関連記事

Pythonのソースコードに特化した検索エンジン『Nulle...

オープンソースの物理ベースGIレンダラ『appleseed』

Googleが画像解析旅行ガイドアプリのJetpac社を買収

NumSharp:C#で使えるNumPyライクな数値計算ライ...

uGUI:Unityの新しいGUI作成システム

ニューラルネットワークと深層学習

UnityでARKit2.0

MLDemos:機械学習について理解するための可視化ツール

Iridescence:プロトタイピング向け軽量3D可視化ラ...

NeRF (Neural Radiance Fields):...

OpenCVで平均顔を作るチュートリアル

Super Resolution:OpenCVの超解像処理モ...

OpenCV3.3.0でsfmモジュールのビルドに成功!

PyTorch3D:3Dコンピュータービジョンライブラリ

Javaで作られたオープンソースの3DCGレンダラ『Sunf...

Composition Rendering:Blenderに...

Mean Stack開発の最初の一歩

Open3D:3Dデータ処理ライブラリ

LLM Visualization:大規模言語モデルの可視化

UnityでPoint Cloudを表示する方法

iOSデバイスと接続して連携するガジェットの開発方法

VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤...

openMVG:複数視点画像から3次元形状を復元するライブラ...

DUSt3R:3Dコンピュータービジョンの基盤モデル

Raspberry Piでセンサーの常時稼働を検討する

プログラミングスキルとは何か?

adskShaderSDK

Mask R-CNN:ディープラーニングによる一般物体検出・...

Iterator

映像ビジネスの未来

AnacondaとTensorFlowをインストールしてVi...

DensePose:画像中の人物表面のUV座標を推定する

ROSの薄い本

サンプルコードにも間違いはある?

OpenCV バージョン4がリリースされた!

OpenCV 3.3.0-RCでsfmモジュールをビルド

Python.NET:Pythonと.NETを連携させるパッ...

hloc:SuperGlueで精度を向上させたSfM・Vis...

3Dグラフィックスの入門書

Model View Controller

Human Generator:Blenderの人体生成アド...

ブログをGoogle App EngineからAmazon ...

コメント