.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

Kubric：機械学習用アノテーション付き動画生成パイプライン

NegativeMind

3年前

久しぶりにコンピュータビジョン系の話題。

Google Researchから機械学習用のアノテーション付き動画を生成するためのツールがオープンソースで公開された↓

Kubric

Kubricは、Instance SegmentationマスクやDepthマップ、オプティカルフローなどのリッチなアノテーション付きのセミリアルな動画を作成するためのデータ生成パイプラインです。

　※このプロジェクトはまだアルファ段階であり、大幅に変更される可能性があります。

モチベーションと設計

機械学習システムの訓練と評価、特にunsupervised multi-object video understandingにおいてはより良いデータが必要です。既存のシステムは、toy datasetsでは上手く行くものの、現実世界のデータでは失敗してしまいます。複雑さの異なる適切なデータセットをオンデマンドで作成できれば、進歩を大幅に加速できる可能性があります。
Kubricは、主にpybullet(物理シミュレーション用)とBlender(レンダリング用)をベースに構築されていますが、コードはモジュール式に保たれているため、様々なレンダリングバックエンドをサポートできる可能性があります。

スポンサーリンク

Kubricは特に数千台のマシンを使って処理できるスケーラビリティに重点を置いて開発されているらしい。
詳しくはarXivで公開されているKubric: A scalable dataset generatorや、公式ドキュメントを参照。

レンダリングに使われているBlenderについてはもはや説明不要でしょう。
物理シミュレーションに使われているpybulletというのは、Bullet Physics SDKというC++の物理シミュレーションフレームワークのPythonバインディング。強化学習方面ではすでに結構利用されているらしい。
https://zenn.dev/ymd_h/articles/14397e6ae7ea3d

Kubricの公式ドキュメントを読むと、一式揃ったDockerイメージも用意されているようですね。
https://kubric.readthedocs.io/en/latest/source/0_installing.html

ここ数年、機械学習用の画像・動画データをCGで生成する需要に応えるツールが少しずつ増えてきたな。

UnrealCV：コンピュータビジョン研究のためのUnreal Engineプラグイン

ROS#もそうですが、ロボット制御ソフトウェアの開発、特にコンピュータビジョン関係は学習やテスト用の画像収集がボトルネックで、最近は学習や動作のシミュレーション環境にCGを活用する例が増えている。このUnrealCVはUnrealEngin...

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

機械学習用の画像データをCGで生成するのもData Augmentation(データ拡張)の範疇でしょうか。物体や風景画像だけでなく、Depthや物体ラベル、Semantic Segmentation用のアノテーション画像も必要となると、C...

最近はUnityが公式にUnity Computer Visionというデータセット生成サービスを始めていて、それに使用しているPerception Packageも公開している↓

Perception Package (Unity Computer Vision)

Perceptionパッケージは、コンピュータビジョンの訓練と検証のための大規模なデータセットを生成するためのツールキットを提供します。現在は、カメラベースのユースケースに焦点を当てており、最終的には他の形式のセンサーや機械学習タスクに拡張される予定です。

ツールと製品の詳細についてはUnity Computer Visionページにアクセスしてください。

https://blog.unity.com/ja/technology/supercharge-your-computer-vision-models-with-synthetic-datasets-built-by-unity

Verilog HDL

PCA (主成分分析)

pythonもかじってみようかと

TensorFlowでCGを微分できる『TensorFlow Graphics』

Kubric

モチベーションと設計

Perception Package (Unity Computer Vision)

関連記事

Verilog HDL

PCA (主成分分析)

pythonもかじってみようかと

TensorFlowでCGを微分できる『TensorFlow Graphics』

Maya 2015から標準搭載されたMILA

ZBrushでUndo Historyを動画に書き出す

組み込み向けのWindows OS 『Windows Embedded』

『スター・ウォーズ/スカイウォーカーの夜明け』のVFXブレイクダウン

ラクガキの立体化 背中の作り込み・手首の移植

映画『ジュラシック・ワールド』のVFXメイキング

ラクガキの立体化 1年半ぶりの続き

DensePose：画像中の人物表面のUV座標を推定する

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

Zbrushでメカ物を作るチュートリアル動画

ラクガキの立体化 進捗

Raspberry Piでセンサーの常時稼働を検討する

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

Leap MotionでMaya上のオブジェクトを操作できるプラグイン

ZBrushの練習 手のモデリング

全脳アーキテクチャ勉強会

Google App Engine上のWordPressでAmazonJSを利用する

ZBrushで仮面ライダー3号を造る 仮面編

UnityユーザーがUnreal Engineの使い方を学ぶには？

mentalrayのSubsurface Scattering Shader『misss_fast_...

ヒーローに変身なりきりアーケードゲーム『ナレルンダー』

Mayaのプラグイン開発

Pythonのソースコードに特化した検索エンジン『Nullege』

Unityで強化学習できる『Unity ML-Agents』

hloc：SuperGlueで精度を向上させたSfM実装

Kaolin：3Dディープラーニング用のPyTorchライブラリ

ZBrushでアマビエを作る その2

Manim：Pythonで使える数学アニメーションライブラリ

JavaScriptとかWebGLとかCanvasとか

openMVGをWindows10 Visual Studio 2015環境でビルドする

NumSharp：C#で使えるNumPyライクな数値計算ライブラリ

UnityからROSを利用できる『ROS#』

書籍『仕事ではじめる機械学習』を読みました

SegNet：ディープラーニングによるSemantic Segmentation手法

書籍『開田裕治 怪獣イラストテクニック』

今年もSSII

Fast R-CNN：ディープラーニングによる一般物体検出手法

GeoGebra：無料で使える数学アプリ

ラクガキの立体化背中の作り込み・手首の移植

ラクガキの立体化進捗

ZBrushの練習手のモデリング

ZBrushで仮面ライダー3号を造る仮面編

ZBrushでアマビエを作るその2

書籍『開田裕治怪獣イラストテクニック』