UnityでOpenCVを使うには?

OpenCVで2D情報をもとに3Dの計算を行う際、実装が間違ってないかopencv_contribのvizモジュールで可視化して確かめてるんだけど、vizモジュールって割と低レベルな機能しか提供していないのでちょっとしんどくなってきた。



デバッグ目的の可視化はUnityEditorぐらい手軽に済ませたいところ。だったら最初からUnityを使ってしまおうと思って調べ始めた。

3つの有料Asset

UnityのAssetStoreで調べてみると、Unity上でOpenCVの機能を使えるようにする有料Assetが3つある。

UnityでOpenCVの機能を使うには、もちろん自分でC++ネイティブプラグインを作るという手もある。
だけど、オイラはあくまで自分の3D実装が正しいのか確認するプロセス(つまりデバッグ)の効率を上げたいので、Assetを購入して手間を減らす方針。もうさっさと課金しちゃいましょう。

最初はこちらのQiita記事を読んでEmguCVに気持ちが傾きかけたんだけど、これはやや古い記事なので今現在の状況を調べた方が良い。↓
http://qiita.com/jhorikawa/items/fafee3373eb3ccef02c8

結論から言うと、OpenCV for Unityを使うことにしました。以下調べたことを順にメモ書き。


OpenCV plus Unity

OpenCV plus Unityは、OpenCVをC#で使えるようにポートしたオープンソースプロジェクトOpenCVSharpがベースになっている。



公式ドキュメントはこちら↓
http://paperplanetools.com/cvwd_doc/html/class_open_cv_sharp_1_1_cv2.html

OpenCV for Unity

OpenCV for Unityは3つの中で断然有名。
https://enoxsoftware.com/opencvforunity/

上記の古いQiita記事では、OpenCVのJavaラッパーをポートしていると書かれていたけど、どうやら現在は違う模様。API仕様はOpenCV Javaに合わせているけど、バックの実装は直にC++っぽいです。処理のオーバーヘッドはあんまり気にしなくて良さそう。(少なくとも、C++でOpenCV vizモジュールを使って可視化するより高速だった)



現在はOpenCVの最新版3.3.04.0.0に対応。UnityのTexture型とOpenCVのMat型を相互に変換するUtilメソッドが用意されているのも魅力。

公式ドキュメントはこちら↓
http://enoxsoftware.github.io/OpenCVForUnity/3.0.0/doc/html/index.html

Emgu CV v3.x

Emgu CV v3.xQiita記事にある通り、OpenCVをクロスプラットフォーム化するオープンソースの.NETラッパープロジェクトEmguCVがベースとなっている。

EmguCVのソースコードはこちら↓
https://github.com/emgucv/emgucv

EmguCV自体はオープンソースだけど、商用利用するには有償版を購入する必要があり、Windows版のみ商用利用不可の無償版が配布されている。↓
https://sourceforge.net/projects/emgucv/

公式ドキュメントはこちら↓
http://www.emgu.com/wiki/index.php/Documentation

決め手

で、オイラ的には、UnityのTexture型とOpenCVのMat型の相互変換メソッドがすでに用意されているOpenCV for Unityがベストに思えたのだ。だって頻繁に行う処理だし。
OpenCV for Unityならユーザーが多くてアップデート頻度も高そうだ。

ところで、どのAssetもopencv_contribArUcoは含まれているのが面白い。AR機能の需要は高いんですかね。


関連記事

Unityをレンダラとして活用する

BlenderでPhotogrammetryできるアドオン

WebGL開発に関する情報が充実してきている

OpenAR:OpenCVベースのマーカーARライブラリ

Pix2Pix:CGANによる画像変換

Kornia:微分可能なコンピュータービジョンライブラリ

MVStudio:オープンソースのPhotogrammetryツール

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

SSII 2014 デモンストレーションセッションのダイジェスト動画

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

PyDataTokyo主催のDeep Learning勉強会

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

Mitsuba 3:オープンソースの研究向けレンダラ

UnityでPoint Cloudを表示する方法

Google Chromecast

Blender 2.8がついに正式リリース!

統計的な顔モデル

SONY製のニューラルネットワークライブラリ『NNabla』

Active Appearance Models(AAM)

UnityのGlobal Illumination

Qlone:スマホのカメラで3Dスキャンできるアプリ

U-Net:ディープラーニングによるSemantic Segmentation手法

ブログのデザイン変えました

NeRF (Neural Radiance Fields):深層学習による新規視点合成

オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート

ブラウザ操作自動化ツール『Selenium』を試す

ZScript

機械学習について最近知った情報

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

映像ビジネスの未来

GoogleのDeep Learning論文

SegNet:ディープラーニングによるSemantic Segmentation手法

フィーリングに基づくタマムシの質感表現

Pythonのソースコードに特化した検索エンジン『Nullege』

画像生成AI Stable Diffusionで遊ぶ

3DCG Meetup #4に行ってきた

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

Raspberry Pi 2を買いました

SSD (Single Shot Multibox Detector):ディープラーニングによる一般...

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

Fast R-CNN:ディープラーニングによる一般物体検出手法

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

コメント