.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

Kaolin：3Dディープラーニング用のPyTorchライブラリ

NegativeMind

5年前

NVIDIAから3D系のディープラーニング研究のためのPyTorchライブラリが公開された。
まだベータ版だから、これからどんどん充実していくんでしょうね。読み方はカオリンで良いのかな？(なんかかわいい)

Kaolin

Kaolinは3Dディープラーニングの研究を加速させるためのPyTorchライブラリです。Kaolinは、ディープラーニングシステムで使用できる微分可能な3Dモジュールを効率的な実装で提供します。
Kaolinには一般的な公開3Dデータセットの読み込みと前処理を行ったり、メッシュ、点群、符号付き距離関数、ボクセルグリッドを操作するネイティブ関数があり、無駄な定型コードの記述を最小限に抑えています。Kaolinは、レンダリング、ライティング、シェーディング、view warpingなどの微分可能なグラフィックスモジュールをパッケージ化しています。また、Kaolinは一連の損失関数と評価指標をサポートすることでシームレスな評価を可能とし、3Dの結果をレンダリングする可視化機能も提供します。

最も重視しているのは、最先端の様々な3Dディープラーニングアーキテクチャを集めた包括的なModel Zooをキュレートし、将来の研究活動の出発点に立つ手助けとなることです。

ドキュメントのページがまだ作成されていないのか404だけど。

NVIDIAの公式ブログ↓
https://news.developer.nvidia.com/kaolin-library-research-3d/
https://blogs.nvidia.co.jp/2019/11/27/kaolin-library-research-3d/

Kaolinって名前は造形用粘土のKaolinite(カオリナイト)が由来なのね。

ベータ版の時点で何ができるのか。

機能

現在、(ベータ版)リリースには、メッシュ、ボクセル、符号付き距離関数、点群での3Dディープラーニングのための処理関数が含まれています。
一般的なデータセット(例：ShapeNet, ModelNet, SHRECなど)の読み込みもすぐにサポートされます。また、いくつかの3D変換および変換操作を実装します。

Kaolinは以下のような3Dタスクをサポートします：

Differentiable rendering (see Neural Mesh Renderer, its PyTorch port, Soft Rasterizer, Differentiable Interpolation-based Renderer, and a modular and extensible abstract DifferentiableRenderer specification).

Single-image based mesh reconstruction (Pixel2Mesh, GEOMetrics, OccupancyNets, and more…)

Pointcloud classification and segmentation (PointNet, PoinNet++, DGCNN, …)

Mesh classification and segmentation (MeshCNN, GCN)

3D superresolution on voxel grids (ODM, VoxelUNet, and more…)

Basic graphics utilities (lighting, shading, etc.)

Model Zoo

Kaolinは、一般的な3Dディープラーニングアーキテクチャのリファレンス実装を含む大規模なModel Zooをキュレーションします。詳しくはこちらでご確認ください。

https://note.com/npaka/m/m85457421b99f

TensorFlowを使うならTensorFlow Graphicsがあるけど、PyTorch派ならKaolinだろうか。

TensorFlowでCGを微分できる『TensorFlow Graphics』

Google I/Oでの発表に合わせて、TensorFlowのネットワークでCG Rendererを扱うためのライブラリ TensorFlow Graphicsが公開された。最近の3DCG系のディープラーニングでよく聞く「微分可能なRend...

あ、Siggraph 2019で発表されて話題になったMeshCNNのモデルもKaolinに含まれてるんですね。

MeshCNNのコードもPyTorchで実装されてるからまあ、すでに割と手軽ではあるんだけど。
https://github.com/ranahanocka/MeshCNN/

Google App Engine上のWordPressでAmazonJSを利用する

ManuelBastioniLAB：人体モデリングできるBlenderアドオン

OpenCVで動画の手ぶれ補正

PyTorch3D：3Dコンピュータービジョンライブラリ

Adobe Photoshop CS4 Extendedの3Dモデル編集機能

Kaolin

機能

Model Zoo

関連記事

Google App Engine上のWordPressでAmazonJSを利用する

ManuelBastioniLAB：人体モデリングできるBlenderアドオン

OpenCVで動画の手ぶれ補正

PyTorch3D：3Dコンピュータービジョンライブラリ

Adobe Photoshop CS4 Extendedの3Dモデル編集機能

ラクガキの立体化 背中の作り込み・手首の移植

Raytracing Wiki

なんかすごいサイト

OpenCV

Python2とPython3

Twitter APIのPythonラッパー『python-twitter』

ZBrushでアヴァン・ガメラを作ってみる 口のバランス調整

『スター・ウォーズ フォースの覚醒』のVFXブレイクダウン まとめ

FacebookがDeep learningツールの一部をオープンソース化

KelpNet：C#で使える可読性重視のディープラーニングライブラリ

デスクトップPCを新調した！

OpenVDB：3Dボリュームデータ処理ライブラリ

ZBrushで仮面ライダー3号を造る 仮面編 Dam Standardブラシでディティールを彫る

Subsurface scatteringの動画

Raspberry Piでセンサーの常時稼働を検討する

Blender 2.81でIntel Open Image Denoiseを使う

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

Unity ARKitプラグインサンプルのドキュメントを読む

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

顔追跡による擬似3D表示『Dynamic Perspective』

UnityのAR FoundationでARKit 3

ファンの力

Maya LTでFBIK(Full Body IK)

フルCGのウルトラマン！？

ZBrushのハードサーフェイス用ブラシ

ZBrushCore

機械学習手法『Random Forest』

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

ROMOハッカソンに行ってきた

GoogleのDeep Learning論文

mentalrayのSubsurface Scattering Shader『misss_fast_...

Pythonのソースコードに特化した検索エンジン『Nullege』

ドットインストールのWordPress入門レッスン

ZBrushのキャンバスにリファレンス画像を配置する

After Effects全エフェクトの解説(6.5)

Kornia：微分可能なコンピュータービジョンライブラリ

画像生成AI Stable Diffusionで遊ぶ

ラクガキの立体化背中の作り込み・手首の移植

ZBrushでアヴァン・ガメラを作ってみる口のバランス調整

『スター・ウォーズフォースの覚醒』のVFXブレイクダウンまとめ

ZBrushで仮面ライダー3号を造る仮面編 Dam Standardブラシでディティールを彫る