Windows10でPyTorchをインストールしてVSCodeで使う

以前はWindows 10でディープラーニングするのに、AnacondaでPython環境を作ってTensorFlowを使ってVisual Studioでコーディングしてたけど、



最近はだいぶ状況が変わってきた。

Anacondaでnumpyが動かなくなったり、使いたいパッケージ(のバージョン)がcondaで入らなかったりで、そもそもAnacondaのメリットよりもデメリットで時間を取られることが増えた。(それはMinicondaでも同じ)
なので、Pythonは普通に公式のインストーラーでWindowsにインストールすることにした。

コーディング環境についても、VSCode(Visual Studio Code)が優秀だと気づいた。
VSCodeはIDEじゃなくてエディタなんだけど、Extensionをインストールして機能拡張はできる。オイラがIDEの方のVisual Studioを使っていた理由の8割ぐらいはIntelliSense(コード補完機能)だったので、同じくIntelliSenseが載っているなら動作も軽いVSCodeの方が快適なのでした。

そして、ディープラーニングのライブラリはTensorFlowからPyTorchへ乗り換えつつある。
理由はそんなにハッキリとしたものじゃないんだけど、最近は発表される論文と一緒に公開されるソースコードにPyTorch実装のものが増えている点と、対応する依存関係(CUDAのバージョンとか)のアップデートの早さとか。最近やっとバージョン1に達して、身近な人達がどんどんPyTorchへ移行しているというのもある。



ということで、今現在のオイラの環境は以下↓

一応、インストール手順もメモしておく。

PyTorch 1.0.1は現時点で最新のCUDA Toolkit 10.1とcuDNN v7.5に対応しているのであんまり気にしなくて良いけど、この手のライブラリのバージョンの依存関係は間違えるとエラー地獄にはまるのでインストール前にしっかり確認した方が良いです。(何度かハマった)

追記:PyTorchとtensorboardXを一緒に使いたい場合は、TensorBoard(というかTensorFlow)の動作環境にも合わせてやる必要があります。
https://www.tensorflow.org/install/gpu

CUDAとcuDNNのインストール

CUDAの公式ページからCUDA Toolkit 10.1のインストーラーをダウンロードしてインストール。
cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1は、まずMembership登録してログインし、cuDNN一式のzipをダウンロードする。
そしてzipを展開して出てきたbin, include, libディレクトリを丸ごとCUDAのパスが通ったディレクトリに配置する。オイラはいつもCUDAデフォルトのインストールパスに一緒に突っ込んでいる↓

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

ところで、cuDNNってCUDA Deep Neural Network libraryの略なんですね。

Pythonのインストール

Pythonはバージョン3.6を使う。公式ページからPython3.6.8のWindows x86-64 executable installerをダウンロードしてきて実行するだけ。
インストールパスだけデフォルトから以下に変えておいた。

C:\dev\Python36

PyTorchのインストール

PyTorchは、公式ページのSTART LOCALLYで自分の環境を選ぶと適切なpipのコマンド表示されるので、それを叩けばインストールできる↓



ということで、以下のコマンドをコマンドプロンプトで実行するだけでPyTorchのインストール完了↓

pip3 install https://download.pytorch.org/whl/cu100/torch-1.0.1-cp36-cp36m-win_amd64.whl
pip3 install torchvision

VSCodeのインストール

VSCodeは公式ページからWindows用のインストーラーをダウンロードしてインストール。
そして日本語の言語パックPython用のExtensionもインストールする。

これでPyTorch環境は整ったので、あとは適当なサンプルコードがちゃんと実行できることを確認してみよう。
GitHubにPyTorch公式のサンプルコードがある↓
https://github.com/pytorch/examples

Basic MNIST Exampleとかが手軽で良いんじゃないでしょうか。
サンプルが実行できたらとりあえずOKだ。

追記:最近は、PyTorchに特化したIDEもある↓


PyTorchの習得

PyTorch公式サイトのサンプルで学ぶPyTorchや、
https://pytorch.org/tutorials/beginner/pytorch_with_examples.html
https://pytorch.org/tutorials/beginner/former_torchies/nnft_tutorial.html

PyTorch公式でチートシートを用意してくれているので、そこを見ると習得が速いかも。
チートシートの内容を画像化して公開している人もいる↓

PyTorch Cheat Sheet

小技集をJupyter Notebookにまとめている方もいる↓
https://github.com/bfortuner/pytorch-cheatsheet/blob/master/pytorch-cheatsheet.ipynb

あとは、torchvisionに有名な畳み込みニューラルネットワークが実装されているので、それを読むと真似しやすいかも↓
https://pytorch.org/docs/stable/torchvision/models.html

追記:PyTorch専用IDEも登場してる↓


関連記事

Human Generator:Blenderの人体生成アドオン

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

SONY製のニューラルネットワークライブラリ『NNabla』

Physics Forests:機械学習で流体シミュレーションを近似する

Konashiを買った

Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

画像生成AI Stable Diffusionで遊ぶ

Blendify:コンピュータービジョン向けBlenderラッパー

チャットツール用bot開発フレームワーク『Hubot』

2022年4月 振り返り

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

FacebookがDeep learningツールの一部をオープンソース化

Pythonのソースコードに特化した検索エンジン『Nullege』

OpenCV 3.1のsfmモジュールを試す

ZBrushのZScript入門

WordPress on Windows Azure

Deep Learningとその他の機械学習手法の性能比較

2D→3D復元技術で使われる用語まとめ

RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』

Unityの薄い本

機械学習で遊ぶ

Mayaのプラグイン開発

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

Facebookの顔認証技術『DeepFace』

DUSt3R:3Dコンピュータービジョンの基盤モデル

cvui:OpenCVのための軽量GUIライブラリ

書籍『イラストで学ぶ ディープラーニング』

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

UnityのTransformクラスについて調べてみた

PythonでMayaのShapeノードプラグインを作る

Webサイトのワイヤーフレームが作成できるオンラインツール

BlenderでPhotogrammetryできるアドオン

Google App Engine上のWordPressでFlickrの画像を貼る

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

OpenCVでPhotoshopのプラグイン開発

OpenMVS:Multi-View Stereoによる3次元復元ライブラリ

Seleniumを使ったFXや株の自動取引

OpenCVでiPhone6sのカメラをキャリブレーションする

Theia:オープンソースのStructure from Motionライブラリ

ROSの薄い本

SDカードサイズのコンピューター『Intel Edison』

コメント