Windows10でPyTorchをインストールしてVSCodeで使う

以前はWindows 10でディープラーニングするのに、AnacondaでPython環境を作ってTensorFlowを使ってVisual Studioでコーディングしてたけど、



最近はだいぶ状況が変わってきた。

Anacondaでnumpyが動かなくなったり、使いたいパッケージ(のバージョン)がcondaで入らなかったりで、そもそもAnacondaのメリットよりもデメリットで時間を取られることが増えた。(それはMinicondaでも同じ)
なので、Pythonは普通に公式のインストーラーでWindowsにインストールすることにした。

コーディング環境についても、VSCode(Visual Studio Code)が優秀だと気づいた。
VSCodeはIDEじゃなくてエディタなんだけど、Extensionをインストールして機能拡張はできる。オイラがIDEの方のVisual Studioを使っていた理由の8割ぐらいはIntelliSense(コード補完機能)だったので、同じくIntelliSenseが載っているなら動作も軽いVSCodeの方が快適なのでした。

そして、ディープラーニングのライブラリはTensorFlowからPyTorchへ乗り換えつつある。
理由はそんなにハッキリとしたものじゃないんだけど、最近は発表される論文と一緒に公開されるソースコードにPyTorch実装のものが増えている点と、対応する依存関係(CUDAのバージョンとか)のアップデートの早さとか。最近やっとバージョン1に達して、身近な人達がどんどんPyTorchへ移行しているというのもある。



ということで、今現在のオイラの環境は以下↓

一応、インストール手順もメモしておく。

PyTorch 1.0.1は現時点で最新のCUDA Toolkit 10.1とcuDNN v7.5に対応しているのであんまり気にしなくて良いけど、この手のライブラリのバージョンの依存関係は間違えるとエラー地獄にはまるのでインストール前にしっかり確認した方が良いです。(何度かハマった)

追記:PyTorchとtensorboardXを一緒に使いたい場合は、TensorBoard(というかTensorFlow)の動作環境にも合わせてやる必要があります。
https://www.tensorflow.org/install/gpu

CUDAとcuDNNのインストール

CUDAの公式ページからCUDA Toolkit 10.1のインストーラーをダウンロードしてインストール。
cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1は、まずMembership登録してログインし、cuDNN一式のzipをダウンロードする。
そしてzipを展開して出てきたbin, include, libディレクトリを丸ごとCUDAのパスが通ったディレクトリに配置する。オイラはいつもCUDAデフォルトのインストールパスに一緒に突っ込んでいる↓

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

ところで、cuDNNってCUDA Deep Neural Network libraryの略なんですね。

Pythonのインストール

Pythonはバージョン3.6を使う。公式ページからPython3.6.8のWindows x86-64 executable installerをダウンロードしてきて実行するだけ。
インストールパスだけデフォルトから以下に変えておいた。

C:\dev\Python36

PyTorchのインストール

PyTorchは、公式ページのSTART LOCALLYで自分の環境を選ぶと適切なpipのコマンド表示されるので、それを叩けばインストールできる↓



ということで、以下のコマンドをコマンドプロンプトで実行するだけでPyTorchのインストール完了↓

pip3 install https://download.pytorch.org/whl/cu100/torch-1.0.1-cp36-cp36m-win_amd64.whl
pip3 install torchvision

VSCodeのインストール

VSCodeは公式ページからWindows用のインストーラーをダウンロードしてインストール。
そして日本語の言語パックPython用のExtensionもインストールする。

これでPyTorch環境は整ったので、あとは適当なサンプルコードがちゃんと実行できることを確認してみよう。
GitHubにPyTorch公式のサンプルコードがある↓
https://github.com/pytorch/examples

Basic MNIST Exampleとかが手軽で良いんじゃないでしょうか。
サンプルが実行できたらとりあえずOKだ。

追記:最近は、PyTorchに特化したIDEもある↓


PyTorchの習得

PyTorch公式サイトのサンプルで学ぶPyTorchや、
https://pytorch.org/tutorials/beginner/pytorch_with_examples.html
https://pytorch.org/tutorials/beginner/former_torchies/nnft_tutorial.html

PyTorch公式でチートシートを用意してくれているので、そこを見ると習得が速いかも。
チートシートの内容を画像化して公開している人もいる↓

PyTorch Cheat Sheet

小技集をJupyter Notebookにまとめている方もいる↓
https://github.com/bfortuner/pytorch-cheatsheet/blob/master/pytorch-cheatsheet.ipynb

あとは、torchvisionに有名な畳み込みニューラルネットワークが実装されているので、それを読むと真似しやすいかも↓
https://pytorch.org/docs/stable/torchvision/models.html

追記:PyTorch専用IDEも登場してる↓


関連記事

Polyscope:3Dデータ操作用GUIライブラリ

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

2022年8月 振り返り

ArUco:OpenCVベースのコンパクトなARライブラリ

OpenSfM:PythonのStructure from Motionライブラリ

機械学習での「回帰」とは?

C++の抽象クラス

Web経由でRaspberry PiのGPIOを操作したい

第1回 3D勉強会@関東『SLAMチュートリアル大会』

UnityでARKit2.0

OpenCVで平均顔を作るチュートリアル

ブラウザ操作自動化ツール『Selenium』を試す

オープンソースのプリント基板設計ツール『KiCad』

機械学習で遊ぶ

Accord.NET Framework:C#で使える機械学習ライブラリ

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

Python.NET:Pythonと.NETを連携させるパッケージ

株式会社ヘキサドライブの研究室ページ

Blendify:コンピュータービジョン向けBlenderラッパー

OpenMesh:オープンソースの3Dメッシュデータライブラリ

OANDAのfxTrade API

ニューラルネットワークと深層学習

OpenAR:OpenCVベースのマーカーARライブラリ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

OpenCVの超解像(SuperResolution)モジュールを試す

CycleGAN:ドメイン関係を学習した画像変換

Cartographer:オープンソースのSLAMライブラリ

Seleniumを使ったFXや株の自動取引

AMIMOTO(PVM版)で作成したインスタンスをAMIMOTO (HVM版)へ移行する

AndroidもopenGLも初心者さ (でもJavaは知ってるよ)

ZBrushのZScript入門

Rerun:マルチモーダルデータの可視化アプリとSDK

マルコフ連鎖モンテカルロ法

Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...

動的なメモリの扱い

Googleが画像解析旅行ガイドアプリのJetpac社を買収

FacebookがDeep learningツールの一部をオープンソース化

WordPressプラグインによるサイトマップの自動生成

OpenCV 3.1のsfmモジュールを試す

Amazon Web ServicesでWordPress

コメント