.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

サイトアイコン NegativeMindException

Kubric:機械学習用アノテーション付き動画生成パイプライン

久しぶりにコンピュータビジョン系の話題。

Google Researchから機械学習用のアノテーション付き動画を生成するためのツールがオープンソースで公開された↓

Kubric



Kubricは、Instance SegmentationマスクやDepthマップ、オプティカルフローなどのリッチなアノテーション付きのセミリアルな動画を作成するためのデータ生成パイプラインです。

 ※このプロジェクトはまだアルファ段階であり、大幅に変更される可能性があります。

モチベーションと設計

機械学習システムの訓練と評価、特にunsupervised multi-object video understandingにおいてはより良いデータが必要です。既存のシステムは、toy datasetsでは上手く行くものの、現実世界のデータでは失敗してしまいます。複雑さの異なる適切なデータセットをオンデマンドで作成できれば、進歩を大幅に加速できる可能性があります。
Kubricは、主にpybullet(物理シミュレーション用)とBlender(レンダリング用)をベースに構築されていますが、コードはモジュール式に保たれているため、様々なレンダリングバックエンドをサポートできる可能性があります。


スポンサーリンク

Kubricは特に数千台のマシンを使って処理できるスケーラビリティに重点を置いて開発されているらしい。
詳しくはarXivで公開されているKubric: A scalable dataset generatorや、公式ドキュメントを参照。



レンダリングに使われているBlenderについてはもはや説明不要でしょう。
物理シミュレーションに使われているpybulletというのは、Bullet Physics SDKというC++の物理シミュレーションフレームワークのPythonバインディング。強化学習方面ではすでに結構利用されているらしい。
https://zenn.dev/ymd_h/articles/14397e6ae7ea3d

Kubricの公式ドキュメントを読むと、一式揃ったDockerイメージも用意されているようですね。
https://kubric.readthedocs.io/en/latest/source/0_installing.html

ここ数年、機械学習用の画像・動画データをCGで生成する需要に応えるツールが少しずつ増えてきたな。


BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
機械学習用の画像データをCGで生成するのもData Augmentation(データ拡張)の範疇でしょうか。物体や風景画像だけでなく、Depthや物体ラベル、Semantic Segmentation用のアノテーション画像も必要となると、C...


最近はUnityが公式にUnity Computer Visionというデータセット生成サービスを始めていて、それに使用しているPerception Packageも公開している↓

Perception Package (Unity Computer Vision)



Perceptionパッケージは、コンピュータビジョンの訓練と検証のための大規模なデータセットを生成するためのツールキットを提供します。 現在は、カメラベースのユースケースに焦点を当てており、最終的には他の形式のセンサーや機械学習タスクに拡張される予定です。

ツールと製品の詳細についてはUnity Computer Visionページにアクセスしてください。

https://blog.unity.com/ja/technology/supercharge-your-computer-vision-models-with-synthetic-datasets-built-by-unity


スポンサーリンク

関連記事

Python for Unity:UnityEditorでPythonを使えるパッケージ

ZBrushで手首のモデリングをリファイン

geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ

ZBrushと液晶ペンタブレットでドラゴンをモデリングするチュートリアル動画

Faster R-CNN:ディープラーニングによる一般物体検出手法

『ハン・ソロ/スター・ウォーズ・ストーリー』のVFXブレイクダウン まとめ

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

PythonのHTML・XMLパーサー『BeautifulSoup』

MRenderUtil::raytrace

為替レートの読み方 2WAYプライス表示

Super Resolution:OpenCVの超解像処理モジュール

CEDEC 3日目

ZBrushでアヴァン・ガメラを作ってみる 下アゴと頭部を作り込む

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

Kinect for Windows v2の日本価格決定

ラクガキの立体化 進捗

SIGGRAPH論文へのリンクサイト

.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...

日本でMakersは普及するだろうか?

KelpNet:C#で使える可読性重視のディープラーニングライブラリ

ジュラシック・パークの続編『ジュラシック・ワールド』

Stanford Bunny

OpenCV 3.1から追加されたSfMモジュール

UnityのTransformクラスについて調べてみた

タマムシっぽい質感

スターウォーズ エピソードVIIの予告編

ZBrushでゴジラ2001を作ってみる 身体のシルエット出し

ZBrushで仮面ライダー3号を造る 仮面編 リファレンス画像の表示

ZBrushでゴジラ2001を作ってみる 目元だけ作り込んでバランスを見る

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

オープンソースのネットワーク可視化ソフトウェアプラットフォーム『Cytoscape』

OpenGVのライブラリ構成

ZBrushの作業環境を見直す

画像生成AI Stable Diffusionで遊ぶ

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

MFnDataとMFnAttribute

ZBrushでアヴァン・ガメラを作ってみる 下半身のバランス調整

ZBrushでアヴァン・ガメラを作ってみる 全体のバランス調整

『ローグ・ワン/スター・ウォーズ・ストーリー』"あのキャラクター"のメイキング

ZBrushのZScript入門

網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した

HerokuでMEAN stack

モバイルバージョンを終了