ArUco:OpenCVベースのコンパクトなARライブラリ

最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。
ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテとデカくても困る。カメラの3次元位置を手軽に計測する手段として考えているのです。

そこで見つけたのがOpenCVベースのArUco。(なんて読むんだ?)
BSDライセンスだそうです。

ArUco

ArUcoの主な特徴:

  • たった1行のC++コードでマーカー検出が可能。
  • ArUcoボード(複数のマーカーで構成されたマーカー)の検出。
  • 依存ライブラリはOpenCVのみ。(バージョン2.4.9以上)
  • 1024個以上の異なる標準のマーカー辞書に加え、さらに多くのHRMマーカーに対応。
  • 手軽にOpenGLとOGREを統合可能。
  • OpenCVによる高速処理と信頼性、クロスプラットフォーム対応。
  • 5分足らずでARアプリを実装できるほど充実したサンプル。
  • BSDライセンス。
  • Python版Javaベータ版が利用可能。

ソースコードをダウンロードしてビルドしてみた感じだと、OpenCV バージョン3でもちゃんと動きそうな感じ。



以前、凹みTipsで詳しく解説されていたので今さらではあるんですけどね。
http://tips.hecomi.com/entry/2015/06/17/234142
http://tips.hecomi.com/entry/2015/09/16/014119

つい最近OpenCVのバージョン3.1がリリースされたけど、リポジトリのopencv_contribに含まれているarucoってこれと同じものなのかな?
https://github.com/Itseez/opencv_contrib/tree/master/modules/aruco

追記:OpenCVのcontribモジュールに含まれているArUcoの使い方についてはdandelionさんがまとめている↓
https://github.com/atinfinity/lab/wiki/ArUco
https://github.com/atinfinity/lab/wiki/aruco%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%E3%81%A7%E3%83%9E%E3%83%BC%E3%82%AB%E3%83%BC%E3%82%92%E7%94%9F%E6%88%90%E3%81%99%E3%82%8B
https://github.com/atinfinity/lab/wiki/aruco%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%E3%81%A7%E3%83%9E%E3%83%BC%E3%82%AB%E3%83%BC%E3%82%92%E6%A4%9C%E5%87%BA%E3%81%99%E3%82%8B

Arucoマーカーだけじゃなくて、チェスボードや、両者を組み合わせたChArUcoマーカーも検出できる。
http://qiita.com/nonbiri15/items/b893cb614d7dd6c8c86a

OpenCV3.2のcontribに含まれているArUcoのチュートリアル↓
http://docs.opencv.org/3.2.0/d9/d6d/tutorial_table_of_content_aruco.html

関連記事

Pythonのソースコードに特化した検索エンジン『Nullege』

iPhoneアプリ開発 Xcode 5のお作法

PeopleSansPeople:機械学習用の人物データをUnityで生成する

顔追跡による擬似3D表示『Dynamic Perspective』

Kaolin:3Dディープラーニング用のPyTorchライブラリ

SSD (Single Shot Multibox Detector):ディープラーニングによる一般...

MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

PyDataTokyo主催のDeep Learning勉強会

続・ディープラーニングの資料

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

3Dモデルを立体視で確認できるVRアプリを作っている

オープンソースの物理ベースGIレンダラ『appleseed』

Human Generator:Blenderの人体生成アドオン

Geogram:C++の3D幾何アルゴリズムライブラリ

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

Alice Vision:オープンソースのPhotogrammetryフレームワーク

Blendify:コンピュータービジョン向けBlenderラッパー

Python拡張モジュールのWindows用インストーラー配布サイト

OpenCV3.3.0でsfmモジュールのビルドに成功!

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

Dlib:C++の機械学習ライブラリ

PyTorch3D:3Dコンピュータービジョンライブラリ

オープンソースのIT資産・ライセンス管理システム『Snipe-IT』

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

SDカードサイズのコンピューター『Intel Edison』

Mean Stack開発の最初の一歩

NeRF (Neural Radiance Fields):深層学習による新規視点合成

CycleGAN:ドメイン関係を学習した画像変換

Quartus II

Iridescence:プロトタイピング向け軽量3D可視化ライブラリ

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

ManuelBastioniLAB:人体モデリングできるBlenderアドオン

UnityのGameObjectの向きをScriptで制御する

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

OpenMayaRender

2D→3D復元技術で使われる用語まとめ

clearcoat Shader

Accord.NET Framework:C#で使える機械学習ライブラリ

ManimML:機械学習の概念を視覚的に説明するためのライブラリ

Google App Engine上のWordPressでFlickrの画像を貼る

コメント