NVIDIAから3D系のディープラーニング研究のためのPyTorchライブラリが公開された。
まだベータ版だから、これからどんどん充実していくんでしょうね。読み方はカオリンで良いのかな?(なんかかわいい)
Kaolin
Kaolinは3Dディープラーニングの研究を加速させるためのPyTorchライブラリです。Kaolinは、ディープラーニングシステムで使用できる微分可能な3Dモジュールを効率的な実装で提供します。
Kaolinには一般的な公開3Dデータセットの読み込みと前処理を行ったり、メッシュ、点群、符号付き距離関数、ボクセルグリッドを操作するネイティブ関数があり、無駄な定型コードの記述を最小限に抑えています。Kaolinは、レンダリング、ライティング、シェーディング、view warpingなどの微分可能なグラフィックスモジュールをパッケージ化しています。また、Kaolinは一連の損失関数と評価指標をサポートすることでシームレスな評価を可能とし、3Dの結果をレンダリングする可視化機能も提供します。
最も重視しているのは、最先端の様々な3Dディープラーニングアーキテクチャを集めた包括的なModel Zooをキュレートし、将来の研究活動の出発点に立つ手助けとなることです。
ドキュメントのページがまだ作成されていないのか404だけど。
NVIDIAの公式ブログ↓
https://news.developer.nvidia.com/kaolin-library-research-3d/
https://blogs.nvidia.co.jp/2019/11/27/kaolin-library-research-3d/
Kaolinって名前は造形用粘土のKaolinite(カオリナイト)が由来なのね。
ベータ版の時点で何ができるのか。
機能
現在、(ベータ版)リリースには、メッシュ、ボクセル、符号付き距離関数、点群での3Dディープラーニングのための処理関数が含まれています。
一般的なデータセット(例:ShapeNet, ModelNet, SHRECなど)の読み込みもすぐにサポートされます。また、いくつかの3D変換および変換操作を実装します。
Kaolinは以下のような3Dタスクをサポートします:
- Differentiable rendering (see Neural Mesh Renderer, its PyTorch port, Soft Rasterizer, Differentiable Interpolation-based Renderer, and a modular and extensible abstract DifferentiableRenderer specification).
- Single-image based mesh reconstruction (Pixel2Mesh, GEOMetrics, OccupancyNets, and more…)
- Pointcloud classification and segmentation (PointNet, PoinNet++, DGCNN, …)
- Mesh classification and segmentation (MeshCNN, GCN)
- 3D superresolution on voxel grids (ODM, VoxelUNet, and more…)
- Basic graphics utilities (lighting, shading, etc.)
Model Zoo
Kaolinは、一般的な3Dディープラーニングアーキテクチャのリファレンス実装を含む大規模なModel Zooをキュレーションします。詳しくはこちらでご確認ください。
https://note.com/npaka/m/m85457421b99f
TensorFlowを使うならTensorFlow Graphicsがあるけど、PyTorch派ならKaolinだろうか。

あ、Siggraph 2019で発表されて話題になったMeshCNNのモデルもKaolinに含まれてるんですね。
MeshCNNのコードもPyTorchで実装されてるからまあ、すでに割と手軽ではあるんだけど。
https://github.com/ranahanocka/MeshCNN/
関連記事
Photoshopで作る怪獣特撮チュートリアル
MRenderUtil::raytrace
ZBrushでゴジラ2001を作ってみる 身体のシルエット出...
データサイエンティストって何だ?
GoB:ZBrushとBlenderを連携させるアドオン
DCGAN (Deep Convolutional GAN)...
Iterator
UnrealCLR:Unreal Engineで.NET C...
ZBrushでアヴァン・ガメラを作ってみる 全体のバランス調...
pythonもかじってみようかと
OpenCVの顔検出過程を可視化した動画
DUSt3R:3Dコンピュータービジョンの基盤モデル
SSD (Single Shot Multibox Dete...
ZBrushCoreのTransposeとGizmo 3D
3D復元技術の情報リンク集
PythonでMayaのShapeノードプラグインを作る
BGSLibrary:OpenCVベースの背景差分ライブラリ
2D→3D復元技術で使われる用語まとめ
Pythonの自然言語処理ライブラリ『NLTK(Natura...
Google XML Sitemap Generatorプラ...
WordPressプラグインによるサイトマップの自動生成
ZBrushでアヴァン・ガメラを作ってみる 歯を配置
機械学習で遊ぶ
ZBrushでUndo Historyを動画に書き出す
OpenCVのバージョン3が正式リリースされたぞ
Twitter APIのPythonラッパー『python-...
Unreal Engine Tokyo MeetUp!へ行っ...
Pix2Pix:CGANによる画像変換
オープンソースのプリント基板設計ツール『KiCad』
C++ 標準テンプレートライブラリ (STL)
ブログをGoogle App EngineからAmazon ...
pythonの機械学習ライブラリ『scikit-learn』
Math Inspector:科学計算向けビジュアルプログラ...
OpenAR:OpenCVベースのマーカーARライブラリ
VCG Library:C++のポリゴン操作ライブラリ
ドットインストールのWordPress入門レッスン
為替レートの読み方 2WAYプライス表示
ラクガキの立体化 背中の作り込み・手首の移植
MFnDataとMFnAttribute
Maya LTのQuick Rigを試す
MFnMeshクラスのsplit関数
頭蓋骨からの顔復元と進化過程の可視化



コメント