Rerun:マルチモーダルデータの可視化アプリとSDK

ここ最近、SNS上で3Dコンピュータービジョン系の可視化にRerunが使われているのをよく見かけるので気になっていた。

Rerun



マルチモーダルデータを時系列で可視化
Rerunは、SDK、時系列データベース、時間的マルチモーダルデータの可視化機能で構成されています。Rerunは、ロボット工学、空間コンピューティング、2D/3D シミュレーション、金融などの分野の検証・デバッグ・説明に使用できます。

Rerun SDK(C++, Python, Rustに対応)を使用すれば、画像、テンソル、点群、テキストなどのデータをログに記録できます。このログは、Rerun Viewerにストリーミングしてリアルタイムに可視化したり、ファイルに保存して後から使用することもできます。

Rerunのコア部分は無料でオープンソースです。

公式サイトのPricingによると有償の商用版はまだ開発中とのことで、2024年7月現在公開されているのは無料で使えるオープンソース版だけ。
オープンソース版はGitHubで公開されておりMITとApache 2のデュアルライセンス。Rerun自体はRustで書かれているようだ。

この手の可視化ツールとしては珍しくRerunには「タイムライン」という概念があり、3D空間でグリグリ視点を動かせるだけでなく、時間方向もビューアから操作して時系列変化を視覚的に確認できる。

公式に可視化のサンプルが沢山公開されている。



全体像としては、Rerun Viewerはユーザーコードとは独立したアプリケーションとして動作し、ユーザーがRerun SDKを介してRerun Viewerへデータ(ログ)を送信すると、Rerun Viewerがそれを受信して可視化してくれるようだ。
このデータ(ログ)の送信は要するにTCP通信らしく、ローカルだろうとネットワーク越しだろうとユーザーコードの開発言語に依存せずRerun Viewerへ送れる。通信のポート番号は任意に設定可能。

使い方


  1. ユーザーコードのマルチモーダルデータをRerun SDKでログ化してストリーミングする
  2. テンソル、点群、テキストなどのログデータからストリームを作成します。複数のソースからの入力、中間状態、出力を簡単に関連付けることができます。

  3. ローカル/リモートを問わず、ライブまたは録画のストリームを可視化して操作する
  4. ライブ/録画のストリームからインタラクティブな可視化を実現します。タイムラインを動的に調整し、データの時間軸を操作できます。

  5. UIやSDKからレイアウトをインタラクティブに構築して可視化をカスタマイズ
  6. Rerunの構成可能データモデルを使用して、データのセマンティクスを表現できます。コードを介して直接、またはUI上でインタラクティブにレイアウトを構築して可視化をカスタマイズできます。

  7. 必要に応じてRerunを拡張する
  8. Rerunの動的スキーマを使用すれば独自形式のデータを記録できます。カスタムビューの使用、または独自のアプリに埋め込むことでRerun Viewerを拡張できます。

OverviewにRerun Viewerの各GUIの説明があるね↓



Top bar & Menu
Top barにはシステムのコントロールと一般的な情報が表示されます。Menuにはアプリケーション全体のオプションとアクションがあります。ビューアの一部を表示/非表示する際は右上隅のボタンを使用します。

Blueprint
Blueprintビューでビューア全体のBlueprint(ビューアに表示される内容・表示方法)を編集できます。

Viewport
Viewportに可視化内容が表示されます。Viewportは自由に配置できる1つ以上のSpace Viewで構成されます。

Selection
Selectionビューでは現在の選択項目の詳細が表示され、その構成を編集できます。

Timeline
Timelineパネルでは、タイムライン上のどの時点を表示するかを制御できます。さらに、指定されたタイムライン上の全てのイベントの概要も表示されます。

https://zenn.dev/higumachan/articles/52b0080ed72a8d

関連記事

Python.NET:Pythonと.NETを連携させるパッ...

PGGAN:段階的に解像度を上げて学習を進めるGAN

iPhone x ロボットハッカソン~RomoのiPhone...

顔のモデリング

Oculus Goを購入!

OpenCV バージョン4がリリースされた!

畳み込みニューラルネットワーク (CNN: Convolut...

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

BlenderのRigifyでリギング

GoogleのDeep Learning論文

ニューラルネットワークで画像分類

2012 昨日のクローズアップ現代を見た

写真から3Dメッシュの生成・編集ができる無料ツール『Auto...

ZBrushでアヴァン・ガメラを作ってみる 歯茎を別パーツへ...

Zibra Liquids:Unity向け流体シミュレーショ...

Phongの表現力パネェ 材質別のPhong Shader用...

映画『アバター:ウェイ・オブ・ウォーター』を観た

AndroidもopenGLも初心者さ (でもJavaは知っ...

PythonのHTML・XMLパーサー『BeautifulS...

ZBrushでアヴァン・ガメラを作ってみる 頭頂部の作り込み...

Maya 2015から標準搭載されたMILA

Unity Scriptコーディング→Unreal Engi...

ManuelBastioniLAB:人体モデリングできるBl...

Blender 4.2以降のWindowsPortable版...

ZBrushでアヴァン・ガメラを作ってみる 下アゴと頭部を作...

UnityのGlobal Illumination

openMVGをWindows10 Visual Studi...

python-twitterで自分のお気に入りを取得する

ZBrushでアヴァン・ガメラを作ってみる 脚のポーズ調整

法線マップを用意してCanvas上でShadingするサンプ...

ZBrushでアヴァン・ガメラを作ってみる 口のバランス調整

UnityでPoint Cloudを表示する方法

ZBrushで仮面ライダー3号を造る 仮面編 ZRemesh...

書籍『仕事ではじめる機械学習』を読みました

BlenderProc:Blenderで機械学習用の画像デー...

Unityの各コンポーネント間でのやり取り

デザインのリファイン再び

オープンソースのネットワーク可視化ソフトウェアプラットフォー...

ZBrushで仮面ライダー3号を造る ベース編

Python2とPython3

ブラウザ操作自動化ツール『Selenium』を試す

CGALDotNet:計算幾何学ライブラリ CGALのC#ラ...

コメント