Windows10でPyTorchをインストールしてVSCodeで使う

以前はWindows 10でディープラーニングするのに、AnacondaでPython環境を作ってTensorFlowを使ってVisual Studioでコーディングしてたけど、

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

TensorFlowがWindowsに対応してから1年ほど経つ。つい最近TensorFlowのバージョン1.4.0がリリースされ、良い機会(？)なので今までの開発環境を洗い替えることにした。今までPythonは単体でインストールしてたんだけ...

最近はだいぶ状況が変わってきた。

Anacondaでnumpyが動かなくなったり、使いたいパッケージ(のバージョン)がcondaで入らなかったりで、そもそもAnacondaのメリットよりもデメリットで時間を取られることが増えた。(それはMinicondaでも同じ)
なので、Pythonは普通に公式のインストーラーでWindowsにインストールすることにした。

コーディング環境についても、VSCode(Visual Studio Code)が優秀だと気づいた。
VSCodeはIDEじゃなくてエディタなんだけど、Extensionをインストールして機能拡張はできる。オイラがIDEの方のVisual Studioを使っていた理由の8割ぐらいはIntelliSense(コード補完機能)だったので、同じくIntelliSenseが載っているなら動作も軽いVSCodeの方が快適なのでした。

そして、ディープラーニングのライブラリはTensorFlowからPyTorchへ乗り換えつつある。
理由はそんなにハッキリとしたものじゃないんだけど、最近は発表される論文と一緒に公開されるソースコードにPyTorch実装のものが増えている点と、対応する依存関係(CUDAのバージョンとか)のアップデートの早さとか。最近やっとバージョン1に達して、身近な人達がどんどんPyTorchへ移行しているというのもある。

ということで、今現在のオイラの環境は以下↓

Windows10 Pro
CUDA Toolkit 10.1
cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1
Python 3.6.8
PyTorch 1.0.1
VSCode
- Japanese Language Pack for Visual Studio Code
- Python extension for Visual Studio Code

一応、インストール手順もメモしておく。

PyTorch 1.0.1は現時点で最新のCUDA Toolkit 10.1とcuDNN v7.5に対応しているのであんまり気にしなくて良いけど、この手のライブラリのバージョンの依存関係は間違えるとエラー地獄にはまるのでインストール前にしっかり確認した方が良いです。(何度かハマった)

追記：PyTorchとtensorboardXを一緒に使いたい場合は、TensorBoard(というかTensorFlow)の動作環境にも合わせてやる必要があります。
https://www.tensorflow.org/install/gpu

CUDAとcuDNNのインストール

CUDAの公式ページからCUDA Toolkit 10.1のインストーラーをダウンロードしてインストール。
cuDNN v7.5.0 (Feb 25, 2019), for CUDA 10.1は、まずMembership登録してログインし、cuDNN一式のzipをダウンロードする。
そしてzipを展開して出てきたbin, include, libディレクトリを丸ごとCUDAのパスが通ったディレクトリに配置する。オイラはいつもCUDAデフォルトのインストールパスに一緒に突っ込んでいる↓
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1
ところで、cuDNNってCUDA Deep Neural Network libraryの略なんですね。

Pythonのインストール

Pythonはバージョン3.6を使う。公式ページからPython3.6.8のWindows x86-64 executable installerをダウンロードしてきて実行するだけ。
インストールパスだけデフォルトから以下に変えておいた。
C:\dev\Python36

PyTorchのインストール

PyTorchは、公式ページのSTART LOCALLYで自分の環境を選ぶと適切なpipのコマンド表示されるので、それを叩けばインストールできる↓

ということで、以下のコマンドをコマンドプロンプトで実行するだけでPyTorchのインストール完了↓
pip3 install https://download.pytorch.org/whl/cu100/torch-1.0.1-cp36-cp36m-win_amd64.whl pip3 install torchvision

VSCodeのインストール

VSCodeは公式ページからWindows用のインストーラーをダウンロードしてインストール。
そして日本語の言語パックとPython用のExtensionもインストールする。

これでPyTorch環境は整ったので、あとは適当なサンプルコードがちゃんと実行できることを確認してみよう。
GitHubにPyTorch公式のサンプルコードがある↓
https://github.com/pytorch/examples

Basic MNIST Exampleとかが手軽で良いんじゃないでしょうか。
サンプルが実行できたらとりあえずOKだ。

追記：最近は、PyTorchに特化したIDEもある↓

TorchStudio：PyTorchのための統合開発環境とエコシステム

PyTorch専用IDE(統合開発環境)のTorchStudioがオープンベータで公開されている↓TorchStudio数クリックでAIモデルのブラウジング、学習、比較ができ、必要であればコーディングも可能です。Connectedオフライン...

PyTorchの習得

PyTorch公式サイトのサンプルで学ぶPyTorchや、
https://pytorch.org/tutorials/beginner/pytorch_with_examples.html
https://pytorch.org/tutorials/beginner/former_torchies/nnft_tutorial.html

PyTorch公式でチートシートを用意してくれているので、そこを見ると習得が速いかも。
チートシートの内容を画像化して公開している人もいる↓

小技集をJupyter Notebookにまとめている方もいる↓
https://github.com/bfortuner/pytorch-cheatsheet/blob/master/pytorch-cheatsheet.ipynb

あとは、torchvisionに有名な畳み込みニューラルネットワークが実装されているので、それを読むと真似しやすいかも↓
https://pytorch.org/docs/stable/torchvision/models.html

追記：PyTorch専用IDEも登場してる↓

TorchStudio：PyTorchのための統合開発環境とエコシステム

Konashiを買った

MeshLab：3Dオブジェクトの確認・変換に便利なフリーウェア

ROSでガンダムを動かす

ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る

Deep Fluids：流体シミュレーションをディープラーニングで近似する

Multi-View Environment：複数画像から3次元形状を再構築するライブラリ

UnityのGameObjectの向きをScriptで制御する

ブログが1日ダウンしてました

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

CUDAとcuDNNのインストール

Pythonのインストール

PyTorchのインストール

VSCodeのインストール

PyTorchの習得

関連記事

Konashiを買った

MeshLab：3Dオブジェクトの確認・変換に便利なフリーウェア

ROSでガンダムを動かす

ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る

Deep Fluids：流体シミュレーションをディープラーニングで近似する

Multi-View Environment：複数画像から3次元形状を再構築するライブラリ

UnityのGameObjectの向きをScriptで制御する

ブログが1日ダウンしてました

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

UnityでARKit2.0

LLM Visualization：大規模言語モデルの可視化

iPhoneアプリ開発 Xcode 5のお作法

Verilog HDL

JavaScriptとかWebGLとかCanvasとか

UnityのGlobal Illumination

OpenVDB：3Dボリュームデータ処理ライブラリ

cvui：OpenCVのための軽量GUIライブラリ

libigl：軽量なジオメトリ処理ライブラリ

bpy-renderer：レンダリング用Pythonパッケージ

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

ニューラルネットワークと深層学習

iPhone x ロボットハッカソン～RomoのiPhone用SDKで目覚ましアプリを作る～

MythTV：Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

Python拡張モジュールのWindows用インストーラー配布サイト

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

Pix2Pix：CGANによる画像変換

画像生成AI Stable Diffusionで遊ぶ

ドットインストールのWordPress入門レッスン

Math Inspector：科学計算向けビジュアルプログラミングツール

U-Net：ディープラーニングによるSemantic Segmentation手法

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

OpenMesh：オープンソースの３Dメッシュデータライブラリ

Cartographer：オープンソースのSLAMライブラリ

3分の動画でプログラミングを学習できるサイト『ドットインストール』

Theia：オープンソースのStructure from Motionライブラリ

﻿OpenCV 3.3.0-RCでsfmモジュールをビルド

Blendify：コンピュータービジョン向けBlenderラッパー

Raspberry Pi 2のGPIOピン配置

OpenCVの超解像(SuperResolution)モジュールを試す

HD画質の無駄遣い

Accord.NET Framework：C#で使える機械学習ライブラリ

NeuralNetwork.NET：.NETで使えるTensorFlowライクなニューラルネットワー...

コメント

個人情報に関するお知らせ

OpenCV 3.3.0-RCでsfmモジュールをビルド