NVIDIAから3D系のディープラーニング研究のためのPyTorchライブラリが公開された。
まだベータ版だから、これからどんどん充実していくんでしょうね。読み方はカオリンで良いのかな?(なんかかわいい)
Kaolin
Kaolinは3Dディープラーニングの研究を加速させるためのPyTorchライブラリです。Kaolinは、ディープラーニングシステムで使用できる微分可能な3Dモジュールを効率的な実装で提供します。
Kaolinには一般的な公開3Dデータセットの読み込みと前処理を行ったり、メッシュ、点群、符号付き距離関数、ボクセルグリッドを操作するネイティブ関数があり、無駄な定型コードの記述を最小限に抑えています。Kaolinは、レンダリング、ライティング、シェーディング、view warpingなどの微分可能なグラフィックスモジュールをパッケージ化しています。また、Kaolinは一連の損失関数と評価指標をサポートすることでシームレスな評価を可能とし、3Dの結果をレンダリングする可視化機能も提供します。
最も重視しているのは、最先端の様々な3Dディープラーニングアーキテクチャを集めた包括的なModel Zooをキュレートし、将来の研究活動の出発点に立つ手助けとなることです。
ドキュメントのページがまだ作成されていないのか404だけど。
NVIDIAの公式ブログ↓
https://news.developer.nvidia.com/kaolin-library-research-3d/
https://blogs.nvidia.co.jp/2019/11/27/kaolin-library-research-3d/
Kaolinって名前は造形用粘土のKaolinite(カオリナイト)が由来なのね。
ベータ版の時点で何ができるのか。
機能
現在、(ベータ版)リリースには、メッシュ、ボクセル、符号付き距離関数、点群での3Dディープラーニングのための処理関数が含まれています。
一般的なデータセット(例:ShapeNet, ModelNet, SHRECなど)の読み込みもすぐにサポートされます。また、いくつかの3D変換および変換操作を実装します。
Kaolinは以下のような3Dタスクをサポートします:
- Differentiable rendering (see Neural Mesh Renderer, its PyTorch port, Soft Rasterizer, Differentiable Interpolation-based Renderer, and a modular and extensible abstract DifferentiableRenderer specification).
- Single-image based mesh reconstruction (Pixel2Mesh, GEOMetrics, OccupancyNets, and more…)
- Pointcloud classification and segmentation (PointNet, PoinNet++, DGCNN, …)
- Mesh classification and segmentation (MeshCNN, GCN)
- 3D superresolution on voxel grids (ODM, VoxelUNet, and more…)
- Basic graphics utilities (lighting, shading, etc.)
Model Zoo
Kaolinは、一般的な3Dディープラーニングアーキテクチャのリファレンス実装を含む大規模なModel Zooをキュレーションします。詳しくはこちらでご確認ください。
https://note.com/npaka/m/m85457421b99f
TensorFlowを使うならTensorFlow Graphicsがあるけど、PyTorch派ならKaolinだろうか。

あ、Siggraph 2019で発表されて話題になったMeshCNNのモデルもKaolinに含まれてるんですね。
MeshCNNのコードもPyTorchで実装されてるからまあ、すでに割と手軽ではあるんだけど。
https://github.com/ranahanocka/MeshCNN/
関連記事
pythonの機械学習ライブラリ『scikit-learn』
ラクガキの立体化 モールドの追加
ZBrushCoreのTransposeとGizmo 3D
Fast R-CNN:ディープラーニングによる一般物体検出手...
『ローグ・ワン/スター・ウォーズ・ストーリー』のVFXブレイ...
顔のモデリング
マルコフ連鎖モンテカルロ法
OpenGVのライブラリ構成
JavaScriptとかWebGLとかCanvasとか
OpenSfM:PythonのStructure from ...
ZBrushでアヴァン・ガメラを作ってみる
konashiのサンプルコードを動かしてみた
ROSの薄い本
ZBrushでゴジラ2001を作ってみる 目元だけ作り込んで...
この連休でZBrushの スキルアップを…
天体写真の3D動画
AnacondaとTensorFlowをインストールしてVi...
Structure from Motion (多視点画像から...
スクレイピング
プロシージャル手法に特化した本が出てるみたい(まだ買わないけ...
ドラマ『ファーストクラス』のモーショングラフィックス
池袋パルコで3Dのバーチャルフィッティング『ウェアラブル ク...
フォトンの放射から格納までを可視化した動画
Mayaのポリゴン分割ツールの進化
ZBrushで基本となるブラシ
UnityでTweenアニメーションを実装できる3種類の無料...
フルCGのウルトラマン!?
オープンソースのテクスチャマッピングシステム『Ptex』
機械学習手法『Random Forest』
Unityで360度ステレオVR動画を作る
PSPNet (Pyramid Scene Parsing ...
ROMOハッカソンに行ってきた
openMVG:複数視点画像から3次元形状を復元するライブラ...
シン・ゴジラのファンアート
畳み込みニューラルネットワーク (CNN: Convolut...
OpenAR:OpenCVベースのマーカーARライブラリ
FacebookがDeep learningツールの一部をオ...
ゴジラ(2014)のディティール制作の舞台裏
為替レートの読み方 2WAYプライス表示
NumSharp:C#で使えるNumPyライクな数値計算ライ...
ZBrushで仮面ライダー3号を造る 仮面編 DynaMes...
SONYの自律型エンタテインメントロボット『aibo』



コメント