Windows10でPyTorchをインストールしてVSCodeで使う

以前はWindows 10でディープラーニングするのに、AnacondaでPython環境を作ってTensorFlowを使ってVisual Studioでコーディングしてたけど、



最近はだいぶ状況が変わってきた。

Anacondaでnumpyが動かなくなったり、使いたいパッケージ(のバージョン)がcondaで入らなかったりで、そもそもAnacondaのメリットよりもデメリットで時間を取られることが増えた。(それはMinicondaでも同じ)
なので、Pythonは普通に公式のインストーラーでWindowsにインストールすることにした。

コーディング環境についても、VSCode(Visual Studio Code)が優秀だと気づいた。
VSCodeはIDEじゃなくてエディタなんだけど、Extensionをインストールして機能拡張はできる。オイラがIDEの方のVisual Studioを使っていた理由の8割ぐらいはIntelliSense(コード補完機能)だったので、同じくIntelliSenseが載っているなら動作も軽いVSCodeの方が快適なのでした。

そして、ディープラーニングのライブラリはTensorFlowからPyTorchへ乗り換えつつある。
理由はそんなにハッキリとしたものじゃないんだけど、最近は発表される論文と一緒に公開されるソースコードにPyTorch実装のものが増えている点と、対応する依存関係(CUDAのバージョンとか)のアップデートの早さとか。最近やっとバージョン1に達して、身近な人達がどんどんPyTorchへ移行しているというのもある。



ということで、今現在のオイラの環境は以下↓

一応、インストール手順もメモしておく。

PyTorch 1.0.1は現時点で最新のCUDA Toolkit 10.1とcuDNN v7.5に対応しているのであんまり気にしなくて良いけど、この手のライブラリのバージョンの依存関係は間違えるとエラー地獄にはまるのでインストール前にしっかり確認した方が良いです。(何度かハマった)

追記:PyTorchとtensorboardXを一緒に使いたい場合は、TensorBoard(というかTensorFlow)の動作環境にも合わせてやる必要があります。
https://www.tensorflow.org/install/gpu

CUDAとcuDNNのインストール

CUDAの公式ページからCUDA Toolkit 10.1のインストーラーをダウンロードしてインストール。
cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1は、まずMembership登録してログインし、cuDNN一式のzipをダウンロードする。
そしてzipを展開して出てきたbin, include, libディレクトリを丸ごとCUDAのパスが通ったディレクトリに配置する。オイラはいつもCUDAデフォルトのインストールパスに一緒に突っ込んでいる↓

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

ところで、cuDNNってCUDA Deep Neural Network libraryの略なんですね。

Pythonのインストール

Pythonはバージョン3.6を使う。公式ページからPython3.6.8のWindows x86-64 executable installerをダウンロードしてきて実行するだけ。
インストールパスだけデフォルトから以下に変えておいた。

C:\dev\Python36

PyTorchのインストール

PyTorchは、公式ページのSTART LOCALLYで自分の環境を選ぶと適切なpipのコマンド表示されるので、それを叩けばインストールできる↓



ということで、以下のコマンドをコマンドプロンプトで実行するだけでPyTorchのインストール完了↓

pip3 install https://download.pytorch.org/whl/cu100/torch-1.0.1-cp36-cp36m-win_amd64.whl
pip3 install torchvision

VSCodeのインストール

VSCodeは公式ページからWindows用のインストーラーをダウンロードしてインストール。
そして日本語の言語パックPython用のExtensionもインストールする。

これでPyTorch環境は整ったので、あとは適当なサンプルコードがちゃんと実行できることを確認してみよう。
GitHubにPyTorch公式のサンプルコードがある↓
https://github.com/pytorch/examples

Basic MNIST Exampleとかが手軽で良いんじゃないでしょうか。
サンプルが実行できたらとりあえずOKだ。

追記:最近は、PyTorchに特化したIDEもある↓


PyTorchの習得

PyTorch公式サイトのサンプルで学ぶPyTorchや、
https://pytorch.org/tutorials/beginner/pytorch_with_examples.html
https://pytorch.org/tutorials/beginner/former_torchies/nnft_tutorial.html

PyTorch公式でチートシートを用意してくれているので、そこを見ると習得が速いかも。
チートシートの内容を画像化して公開している人もいる↓

PyTorch Cheat Sheet

小技集をJupyter Notebookにまとめている方もいる↓
https://github.com/bfortuner/pytorch-cheatsheet/blob/master/pytorch-cheatsheet.ipynb

あとは、torchvisionに有名な畳み込みニューラルネットワークが実装されているので、それを読むと真似しやすいかも↓
https://pytorch.org/docs/stable/torchvision/models.html

追記:PyTorch専用IDEも登場してる↓


関連記事

Quartus II

株式会社ヘキサドライブの研究室ページ

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

UnityからROSを利用できる『ROS#』

Math Inspector:科学計算向けビジュアルプログラミングツール

HerokuでMEAN stack

Human Generator:Blenderの人体生成アドオン

Boost オープンソースライブラリ

libigl:軽量なジオメトリ処理ライブラリ

Blender 4.2以降のWindowsPortable版の設定ファイルの保存場所

2022年4月 振り返り

Iterator

TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

ManimML:機械学習の概念を視覚的に説明するためのライブラリ

ディープラーニング

Python拡張モジュールのWindows用インストーラー配布サイト

Unityからkonashiをコントロールする

ニューラルネットワークで画像分類

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

ROSでガンダムを動かす

2D→3D復元技術で使われる用語まとめ

Rerun:マルチモーダルデータの可視化アプリとSDK

オープンソースの顔の動作解析ツールキット『OpenFace』

AR (Augmented Reality)とDR (Diminished Reality)

画像生成AI Stable Diffusionで遊ぶ

Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』

Deep Learningとその他の機械学習手法の性能比較

AfterEffectsプラグイン開発

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

ブログのデザイン変えました

OpenSfM:PythonのStructure from Motionライブラリ

python-twitterで自分のお気に入りを取得する

UnityプロジェクトをGitHubで管理する

DensePose:画像中の人物表面のUV座標を推定する

Theia:オープンソースのStructure from Motionライブラリ

MVStudio:オープンソースのPhotogrammetryツール

OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

WinSCP

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

Zibra Liquids:Unity向け流体シミュレーションプラグイン

コメント