TorchStudio:PyTorchのための統合開発環境とエコシステム

PyTorch専用IDE(統合開発環境)のTorchStudioがオープンベータで公開されている↓

TorchStudio

数クリックでAIモデルのブラウジング、学習、比較ができ、必要であればコーディングも可能です。

Connected
オフライン・オンライン問わず、数千のデータセットやモデルをブラウジング、ロードできます。 ローカルでもリモートでもモデルの構築と学習ができます。

Visual
データセットを探索、分析、再フォーマットできます。モデルを可視化してデバッグできます。学習をを監視して比較できます。

Flexible
データセット、モデル、アナライザー、損失関数、メトリックなどのモジュールの追加・編集できます。全てデータとパラメーターを互換性のある形式で保存できます。

TorchStudioはWindows, Mac, Ubuntuに対応しており、各プラットフォーム用のインストーラーが配布されている。
リポジトリはGitHubで公開されている↓
https://github.com/TorchStudio/torchstudio

言われてみれば確かに、機械学習においてコーディング自体はそこまで重要じゃない。
どちらかというと、データセットがどんな構成か、学習中に何が起こっているのか、学習済みモデルがどんな性質になったかを確かめるために、探索的にコードを書かざるを得ないだけだ。
機械学習でのコーディングの目的を考えると、やっていることはプログラム開発というよりデバッグに近い。
機械学習の環境に必要なのは可視化・分析機能だ。IDEで言うところのデバッグツールに相当する機能。

追記:各IDE向けのExtensionの配布もはじまった。対応するIDEは、VSCode, PyCharm, Spyder, Sublime。



公式チュートリアルGet Startedをやってみよう↓

Get Started

TorchStudioをインストールしてデータセットを読み込み、モデルを訓練して学習結果を保存する。

TorchStudioのインストール

ご自分の環境に対応したインストーラーをダウンロードしてください:Download

インストーラーを実行し、インストールが完了したらTorchStudioを起動してInstallをクリックしてコンピューターにローカルのPyTorch環境をインストールします。


MNISTデータセットの読み込み・分析

最初にDatasetタブが表示されます。

torchvision.datasetsカテゴリーを選択し、MNISTデータセットを選択してください。このデータセットは、手書きの数字とそれに対応する解釈で構成されています。



次に、Loadをクリックしてください。このデータセットがまだコンピューターに無い場合は自動的にダウンロードされます。

データセットが読み込まれると、このデータセットを探索できるようになります。(他のサンプルを表示するには、Sample 0の値を変更してください)

Optionally click Analyze to produce an analysis report of this dataset.
必要に応じて、Analyzeをクリックしてこのデータセットの分析レポートを作成できます。


MNIST分類モデルを構築して学習する

Click the plus button at the top, next to the Dataset tab. This will create your first model.
上部のDatasetタブの横にあるボタンをクリックしてください。これで最初のモデルが作成されます。

torchstudio.modelsカテゴリーとMNISTClassifierモデルを選択してください。



次に、Buildをクリックしてください。このデータセットがまだコンピューターに無い場合は自動的にダウンロードされます。

モデルが構築されると、そのモデルのGraph表現(上部の入力から下部の出力まで、内部でノードがどのように接続されているか)を確認できます。



この段階では、AIモデルがまだ手書きの数字を正しく解釈できないことに注意してください。Input画面に5が表示されていますが、Output画面には全ての解釈についてほぼ等しい確率が表示されています。

それでは、Trainをクリックしてモデルの学習を開始しましょう。

数分後、Metricプロットが増加するのがわかるはずです。(右下のパネル) これはモデルが適切に学習されており、より正確な解釈が行われていることを意味します。また、Input画面の手書きの数字がOutput画面で正しく解釈されているのが確認できるはずです。



これで全て完了です! 最初のAIモデルを学習できました。

学習結果の保存

Stop Trainingをクリックして > Save Projectをクリックしてプロジェクトを保存するか、 > Export Model…をクリックして学習済みモデルをエクスポートできます。(TorchScriptまたはONNX形式のいずれかを選択してください)


関連記事

Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

Structure from Motion (多視点画像からの3次元形状復元)

Pix2Pix:CGANによる画像変換

Pythonのソースコードに特化した検索エンジン『Nullege』

Dlib:C++の機械学習ライブラリ

フリーのUV展開ツール Roadkill UV Tool

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

GoogleのDeep Learning論文

WebGL開発に関する情報が充実してきている

adskShaderSDK

無料の英文チェックWebサービス『PaperRater』

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

このブログのデザインに飽きてきた

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

WordPressのテーマを自作する

html5のcanvasの可能性

Zibra Liquids:Unity向け流体シミュレーションプラグイン

UnityでARKit2.0

立体映像プレイヤー『Stereoscopic Player』

MeshLab:3Dオブジェクトの確認・変換に便利なフリーウェア

Physics Forests:機械学習で流体シミュレーションを近似する

Math.NET Numerics:Unityで使える数値計算ライブラリ

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

Geogram:C++の3D幾何アルゴリズムライブラリ

PythonでMayaのShapeノードプラグインを作る

第25回コンピュータビジョン勉強会@関東に行って来た

Kinect for Windows V2のプレオーダー開始

Super Resolution:OpenCVの超解像処理モジュール

書籍『仕事ではじめる機械学習』を読みました

コンピュータビジョンの技術マップ

書籍『OpenCV 3 プログラミングブック』を購入

Rerun:マルチモーダルデータの可視化アプリとSDK

動的なメモリの扱い

Google Colaboratoryで遊ぶ準備

PeopleSansPeople:機械学習用の人物データをUnityで生成する

顔画像処理技術の過去の研究

AndroidもopenGLも初心者さ (でもJavaは知ってるよ)

フィクションに登場するUIデザインのまとめサイト

クラスの基本

コメント