CGのためのディープラーニング

もう半年前のことですが、昨年12月に東京国際フォーラムで開催されたSiggraph Asia 2018 Tokyoで聴講したCourse CreativeAI:Deep Learning for Graphicsの復習を(今頃)しておこうかと。
「CGのためのディープラーニング」とか「CGに使えるディープラーニング」という趣旨でしょうか。
途中休憩を挟んだとはいえ、3時間を超えるセッションは結構しんどくもあり、すぐに咀嚼できなかったのである。

幸い、Courseの資料はWebで公開されている↓

CreativeAI:Deep Learning for Graphics



近年、古くからコンピューターグラフィックス分野で課題とされてきたことの多くが、データドリブンな手法 ディープラーニングの登場によって上手く扱えるようになってきた。deep networkは様々な課題設定で利用され、従来のハンドクラフトな手法に圧倒的な差をつけてstate-of-the-artを達成している。
本チュートリアルでは、ディープラーニングの理論、実践、そしてグラフィックス分野へ応用事例を解説する。

いつのまにやらページが更新されていた。このCourseはSiggraph Asia 2018だけでなく、Eurographics 2018でもやってたんですね。
そして、どうやら今年の夏のSiggraph 2019でもこのCourseが設けられるらしい。CG分野でもディープラーニングの注目度はかなり高いようだ。

Courseのサンプルコード(Jupyter)も公開されている↓
https://github.com/smartgeometry-ucl/dl4g



とりあえず、Siggraph Asia 2018で使われた資料で復習していこう。
すでに機械学習やニューラルネットワーク、識別モデル(Discriminative Model)の基本的な知識があるなら、Part 14は読み飛ばして、教師なし学習、生成モデル(Generative Model)についてのPart 5ぐらいから読み始めれば良い。

というか、オイラ自身がまだ教師なし学習や生成モデルについてあんまりよく知らないのである。
http://kento1109.hatenablog.com/entry/2018/01/10/111249

今のところ生成モデルについては
あるドメインの確率分布を学習した生成モデルに任意のパラメータを与えると、必ずそのドメインに収まる生成結果が出力される。
というレンダラのような存在と理解している。

GANの勉強しようと思ってたけど、Autoencoderからちゃんと見て行った方が良さそうだ。

  • Autoencoder
  • VAE:Variational Autoencoder
  • GAN:Generative Adversarial Networks

Part 6で紹介されているように、生成モデルのグラフィックスへの応用は画像がかなり先行している。これはディープラーニングの識別モデルで画像を扱う研究が盛んな恩恵か。畳み込みニューラルネットワークが大活躍。

Part 7では、CG分野で使われる3Dデータをニューラルネットワークで扱えるベクトルの形に落とし込んで畳み込むための様々な工夫が紹介されている。
最近、GitHubで3Dのデータを扱った機械学習手法をまとめているリポジトリの存在を知った↓
https://github.com/timzhang642/3D-Machine-Learning

Part 8ではモーションのパラメータを少ない次元に圧縮して表現したり、粗い流体シミュレーションを超解像化したり。
そういえば、流体シミュレーションを機械学習で近似して高速化するアプローチもありましたね↓


Deep Fluids:流体シミュレーションをディープラーニングで近似する
チューリッヒ工科大学(ETH Zurich)、ミュンヘン工科大学、Pixarによるディープラーニングで流体シミュレーションを近似する研究 Deep Fluids: A Generative Network for Parameterized...


う〜ん、復習しようにも案外スライドに載っている情報は少なかったな…

このCourseでは触れられてなかったけど、CGレンダリングの各プロセスを微分可能にするアプローチはどういうジャンルなんだろう。
TensorFlowでCGを微分できる『TensorFlow Graphics』
Google I/Oでの発表に合わせて、TensorFlowのネットワークでCG Rendererを扱うためのライブラリ TensorFlow Graphicsが公開された。最近の3DCG系のディープラーニングでよく聞く「微分可能なRend...


Neural 3D Mesh Rendererが有名だけど。
https://qiita.com/no_more_syakai/items/f1358e33e8376ae1766d
http://ai-scholar.tech/treatise/renderer-ai-215/

とりあえずPyTorch実装を読んでみるか?
https://github.com/daniilidis-group/neural_renderer

CGのためのディープラーニングについて、もうちょっと詳しい情報がないかと探していたら、電子情報通信学会の総合大会で筑波大学の金森先生が講演したスライドが公開されていた↓

CG分野は人間が手作業で多次元のパラメータを編集していると考えると狂気の世界だけど、CGって従来そういう人達が牽引してきた産業なのよね。
パラメータをいじってはレンダリング結果を確かめる試行錯誤って、機械学習と似ている気もする。

追記:とりあえずGANについて勉強し始めた↓



2020年6月 追記:Hands-on Workshop Machine Learning and Neural Networksの動画が公開されたぞ↓


関連記事

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

Google Earth用の建物を簡単に作れるツール Google Building Maker 公...

Runway ML:クリエイターのための機械学習ツール

OpenCVでPhotoshopのプラグイン開発

Geogram:C++の3D幾何アルゴリズムライブラリ

ZBrush キャラクター&クリーチャー

Texturing & Modeling A Procedural ApproachをGoo...

Mitsuba 3:オープンソースの研究向けレンダラ

UnityでARKit2.0

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

Physically Based Rendering

PeopleSansPeople:機械学習用の人物データをUnityで生成する

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...

PythonでMayaのShapeノードプラグインを作る

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

SDカードサイズのコンピューター『Intel Edison』

SIGGRAPH ASIAのマスコット

ZBrushでアヴァン・ガメラを作ってみる 頭頂部の作り込み・舌の追加

Active Appearance Models(AAM)

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

NeRF (Neural Radiance Fields):深層学習による新規視点合成

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

SSII2014 チュートリアル講演会の資料

CGAN (Conditional GAN):条件付き敵対的生成ネットワーク

iPhone 3GSがますます欲しくなる動画

KelpNet:C#で使える可読性重視のディープラーニングライブラリ

UnityでOpenCVを使うには?

オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う

書籍『OpenCV 3 プログラミングブック』を購入

Maya には3 種類のシェーダSDKがある?

geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ

uGUI:Unityの新しいGUI作成システム

書籍『仕事ではじめる機械学習』を読みました

CycleGAN:ドメイン関係を学習した画像変換

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

『ピクサー展』へ行ってきた

ラクガキの立体化 3Dプリント注文

Blenderでよく使うaddon

Live CV:インタラクティブにComputer Visionコーディングができるツール

U-Net:ディープラーニングによるSemantic Segmentation手法

VCG Library:C++のポリゴン操作ライブラリ

コメント