Kaolin:3Dディープラーニング用のPyTorchライブラリ

NVIDIAから3D系のディープラーニング研究のためのPyTorchライブラリが公開された。
まだベータ版だから、これからどんどん充実していくんでしょうね。読み方はカオリンで良いのかな?(なんかかわいい)

Kaolin



Kaolinは3Dディープラーニングの研究を加速させるためのPyTorchライブラリです。Kaolinは、ディープラーニングシステムで使用できる微分可能な3Dモジュールを効率的な実装で提供します。
Kaolinには一般的な公開3Dデータセットの読み込みと前処理を行ったり、メッシュ、点群、符号付き距離関数、ボクセルグリッドを操作するネイティブ関数があり、無駄な定型コードの記述を最小限に抑えています。Kaolinは、レンダリング、ライティング、シェーディング、view warpingなどの微分可能なグラフィックスモジュールをパッケージ化しています。また、Kaolinは一連の損失関数と評価指標をサポートすることでシームレスな評価を可能とし、3Dの結果をレンダリングする可視化機能も提供します。

最も重視しているのは、最先端の様々な3Dディープラーニングアーキテクチャを集めた包括的なModel Zooをキュレートし、将来の研究活動の出発点に立つ手助けとなることです。

ドキュメントのページがまだ作成されていないのか404だけど。

NVIDIAの公式ブログ↓
https://news.developer.nvidia.com/kaolin-library-research-3d/
https://blogs.nvidia.co.jp/2019/11/27/kaolin-library-research-3d/

Kaolinって名前は造形用粘土のKaolinite(カオリナイト)が由来なのね。



ベータ版の時点で何ができるのか。

機能



現在、(ベータ版)リリースには、メッシュ、ボクセル、符号付き距離関数、点群での3Dディープラーニングのための処理関数が含まれています。
一般的なデータセット(例:ShapeNet, ModelNet, SHRECなど)の読み込みもすぐにサポートされます。また、いくつかの3D変換および変換操作を実装します。

Kaolinは以下のような3Dタスクをサポートします:

  • Differentiable rendering (see Neural Mesh Renderer, its PyTorch port, Soft Rasterizer, Differentiable Interpolation-based Renderer, and a modular and extensible abstract DifferentiableRenderer specification).
  • Single-image based mesh reconstruction (Pixel2Mesh, GEOMetrics, OccupancyNets, and more…)
  • Pointcloud classification and segmentation (PointNet, PoinNet++, DGCNN, …)
  • Mesh classification and segmentation (MeshCNN, GCN)
  • 3D superresolution on voxel grids (ODM, VoxelUNet, and more…)
  • Basic graphics utilities (lighting, shading, etc.)

Model Zoo

Kaolinは、一般的な3Dディープラーニングアーキテクチャのリファレンス実装を含む大規模なModel Zooをキュレーションします。詳しくはこちらでご確認ください。

https://note.com/npaka/m/m85457421b99f

TensorFlowを使うならTensorFlow Graphicsがあるけど、PyTorch派ならKaolinだろうか。



あ、Siggraph 2019で発表されて話題になったMeshCNNのモデルもKaolinに含まれてるんですね。



MeshCNNのコードもPyTorchで実装されてるからまあ、すでに割と手軽ではあるんだけど。
https://github.com/ranahanocka/MeshCNN/

関連記事

映画『ジュラシック・ワールド/炎の王国』のVFXブレイクダウン まとめ

OpenCVの超解像(SuperResolution)モジュールを試す

無料で使える人体3DCG作成ツール

テスト

MRenderUtil::raytrace

ポリゴン用各種イテレータと関数セット

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

Mayaのシェーディングノードの区分

PythonでBlenderのAdd-on開発

書籍『開田裕治 怪獣イラストテクニック』

UnityでPoint Cloudを表示する方法

世界一下品なクマと世界一紳士なクマ

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

ZBrushでアヴァン・ガメラを作ってみる 全体のバランス調整 その2

Ambient Occlusionを解析的に求める

konashiのサンプルコードを動かしてみた

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

機械学習での「回帰」とは?

白組による『シン・ゴジラ』CGメイキング映像が公開された!

MLDemos:機械学習について理解するための可視化ツール

生物の骨格

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン

GeoGebra:無料で使える数学アプリ

天体写真の3D動画

為替レートの読み方 2WAYプライス表示

Physically Based Rendering

TensorFlowでCGを微分できる『TensorFlow Graphics』

ZBrush 2018へのアップグレード

UnityのTransformクラスについて調べてみた

ZBrushのUV MasterでUV展開

uvでWindows11のPython環境を管理する

デスクトップPCを新調した!

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

Unityをレンダラとして活用する

TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク

VCG Library:C++のポリゴン操作ライブラリ

BlenderのGeometry Nodeで遊ぶ

映画『シン・仮面ライダー』 メイキング情報まとめ

トランスフォーマー/ロストエイジのメイキング

ROMOハッカソンに行ってきた

素敵なパーティクル

コメント