3Dディープラーニング用のPyTorchライブラリ『Kaolin』

NVIDIAから3D系のディープラーニング研究のためのPyTorchライブラリが公開された。
まだベータ版だから、これからどんどん充実していくんでしょうね。読み方はカオリンで良いのかな?(なんかかわいい)

Kaolin



Kaolinは3Dディープラーニングの研究を加速させるためのPyTorchライブラリです。Kaolinは、ディープラーニングシステムで使用できる微分可能な3Dモジュールを効率的な実装で提供します。
Kaolinには一般的な公開3Dデータセットの読み込みと前処理を行ったり、メッシュ、点群、符号付き距離関数、ボクセルグリッドを操作するネイティブ関数があり、無駄な定型コードの記述を最小限に抑えています。Kaolinは、レンダリング、ライティング、シェーディング、view warpingなどの微分可能なグラフィックスモジュールをパッケージ化しています。また、Kaolinは一連の損失関数と評価指標をサポートすることでシームレスな評価を可能とし、3Dの結果をレンダリングする可視化機能も提供します。

最も重視しているのは、最先端の様々な3Dディープラーニングアーキテクチャを集めた包括的なModel Zooをキュレートし、将来の研究活動の出発点に立つ手助けとなることです。

ドキュメントのページがまだ作成されていないのか404だけど。

NVIDIAの公式ブログ↓
https://news.developer.nvidia.com/kaolin-library-research-3d/
https://blogs.nvidia.co.jp/2019/11/27/kaolin-library-research-3d/

Kaolinって名前は造形用粘土のKaolinite(カオリナイト)が由来なのね。


スポンサーリンク


ベータ版の時点で何ができるのか。


スポンサーリンク

機能



現在、(ベータ版)リリースには、メッシュ、ボクセル、符号付き距離関数、点群での3Dディープラーニングのための処理関数が含まれています。
一般的なデータセット(例:ShapeNet, ModelNet, SHRECなど)の読み込みもすぐにサポートされます。また、いくつかの3D変換および変換操作を実装します。

Kaolinは以下のような3Dタスクをサポートします:

  • Differentiable rendering (see Neural Mesh Renderer, its PyTorch port, Soft Rasterizer, Differentiable Interpolation-based Renderer, and a modular and extensible abstract DifferentiableRenderer specification).
  • Single-image based mesh reconstruction (Pixel2Mesh, GEOMetrics, OccupancyNets, and more…)
  • Pointcloud classification and segmentation (PointNet, PoinNet++, DGCNN, …)
  • Mesh classification and segmentation (MeshCNN, GCN)
  • 3D superresolution on voxel grids (ODM, VoxelUNet, and more…)
  • Basic graphics utilities (lighting, shading, etc.)

Model Zoo

Kaolinは、一般的な3Dディープラーニングアーキテクチャのリファレンス実装を含む大規模なModel Zooをキュレーションします。詳しくはこちらでご確認ください。

https://note.com/npaka/m/m85457421b99f

TensorFlowを使うならTensorFlow Graphicsがあるけど、PyTorch派ならKaolinだろうか。



あ、Siggraph 2019で発表されて話題になったMeshCNNのモデルもKaolinに含まれてるんですね。

MeshCNN: A Network with an Edge [SIGGRAPH 2019]

MeshCNNのコードもPyTorchで実装されてるからまあ、すでに割と手軽ではあるんだけど。
https://github.com/ranahanocka/MeshCNN/


スポンサーリンク

関連記事

WordPressのテーマを自作する
オープンソースのテクスチャマッピングシステム『Ptex』
書籍『メイキング・オブ・ピクサー 創造力をつくった人々』を読んだ
中学3年生が制作した短編映像作品『2045』
openMVGをWindows10 Visual Studio 2015環境でビルドする
Google Earth用の建物を簡単に作れるツール Google Building Maker 公...
ZBrushの練習 手のモデリング
CGAN (Conditional GAN):条件付き敵対的生成ネットワーク
ZBrushのお勉強
Blender 2.8がついに正式リリース!
ゴジラ(2014)のメイキング
映画から想像するVR・AR時代のGUIデザイン
Google App Engine上のWordPressでFlickrの画像を貼る
オープンソースのIT資産・ライセンス管理システム『Snipe-IT』
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
C++の機械学習ライブラリ『Dlib』
GoB:ZBrushとBlenderを連携させるアドオン
Vancouver Film Schoolのデモリール
iPhoneアプリ開発 Xcode 5のお作法
Siggraph Asia 2009 カンファレンスの詳細
Point Cloud Libraryに動画フォーマットが追加されるらしい
仮想関数
複数視点画像から3次元形状を復元するライブラリ『openMVG』
ブログが1日ダウンしてました
ZBrushで仮面ライダー3号を造る 仮面編 Clay Polish
C++の抽象クラス
ファンの力
iPhone欲しいなぁ
UnityでShaderの入力パラメータとして行列を渡す
ちょっと凝り過ぎなWebキャンペーン:全日本バーベイタム選手権 (MITSUBISHI KAGAKU...
フリーのUV展開ツール Roadkill UV Tool
UnityからROSを利用できる『ROS#』
Web経由でRaspberry PiのGPIOを操作したい
SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
ガメラ生誕50周年
AmazonEC2のインスタンスをt1.microからt2.microへ移行する
UnityでTweenアニメーションを実装できる3種類の無料Asset
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
株式会社ヘキサドライブの研究室ページ
Amazon Web ServicesでWordPress
オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う

コメント