ArUco:OpenCVベースのコンパクトなARライブラリ

最近、ARToolKit以外にもっとコンパクトなARライブラリがないか調べてる。
ARアプリを作りたいわけじゃなくて、アプリケーション開発の部品として、単眼カメラによるマーカー認識で3次元座標を取得する機能が欲しいだけなので、あんまりゴテゴテとデカくても困る。カメラの3次元位置を手軽に計測する手段として考えているのです。

そこで見つけたのがOpenCVベースのArUco。(なんて読むんだ?)
BSDライセンスだそうです。

ArUco

ArUcoの主な特徴:

  • たった1行のC++コードでマーカー検出が可能。
  • ArUcoボード(複数のマーカーで構成されたマーカー)の検出。
  • 依存ライブラリはOpenCVのみ。(バージョン2.4.9以上)
  • 1024個以上の異なる標準のマーカー辞書に加え、さらに多くのHRMマーカーに対応。
  • 手軽にOpenGLとOGREを統合可能。
  • OpenCVによる高速処理と信頼性、クロスプラットフォーム対応。
  • 5分足らずでARアプリを実装できるほど充実したサンプル。
  • BSDライセンス。
  • Python版Javaベータ版が利用可能。

ソースコードをダウンロードしてビルドしてみた感じだと、OpenCV バージョン3でもちゃんと動きそうな感じ。



以前、凹みTipsで詳しく解説されていたので今さらではあるんですけどね。
http://tips.hecomi.com/entry/2015/06/17/234142
http://tips.hecomi.com/entry/2015/09/16/014119

つい最近OpenCVのバージョン3.1がリリースされたけど、リポジトリのopencv_contribに含まれているarucoってこれと同じものなのかな?
https://github.com/Itseez/opencv_contrib/tree/master/modules/aruco

追記:OpenCVのcontribモジュールに含まれているArUcoの使い方についてはdandelionさんがまとめている↓
https://github.com/atinfinity/lab/wiki/ArUco
https://github.com/atinfinity/lab/wiki/aruco%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%E3%81%A7%E3%83%9E%E3%83%BC%E3%82%AB%E3%83%BC%E3%82%92%E7%94%9F%E6%88%90%E3%81%99%E3%82%8B
https://github.com/atinfinity/lab/wiki/aruco%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%E3%81%A7%E3%83%9E%E3%83%BC%E3%82%AB%E3%83%BC%E3%82%92%E6%A4%9C%E5%87%BA%E3%81%99%E3%82%8B

Arucoマーカーだけじゃなくて、チェスボードや、両者を組み合わせたChArUcoマーカーも検出できる。
http://qiita.com/nonbiri15/items/b893cb614d7dd6c8c86a

OpenCV3.2のcontribに含まれているArUcoのチュートリアル↓
http://docs.opencv.org/3.2.0/d9/d6d/tutorial_table_of_content_aruco.html

関連記事

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

Mean Stack開発の最初の一歩

Raspberry Pi 2を買いました

Python.NET:Pythonと.NETを連携させるパッケージ

ブログが1日ダウンしてました

OpenCVの超解像(SuperResolution)モジュールを試す

OpenMVSのサンプルを動かしてみる

Pythonのソースコードに特化した検索エンジン『Nullege』

UnityのAR FoundationでARKit 3

Accord.NET Framework:C#で使える機械学習ライブラリ

画像生成AI Stable Diffusionで遊ぶ

OpenAR:OpenCVベースのマーカーARライブラリ

Point Cloud Libraryに動画フォーマットが追加されるらしい

viser:Pythonで使える3D可視化ライブラリ

Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...

PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...

立体視を試してみた

Google Chromecast

ニューラルネットワークで画像分類

Open Shading Language (OSL)

clearcoat Shader

PeopleSansPeople:機械学習用の人物データをUnityで生成する

フィーリングに基づくタマムシの質感表現

SDカードサイズのコンピューター『Intel Edison』

VCG Library:C++のポリゴン操作ライブラリ

Boost オープンソースライブラリ

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

SONY製のニューラルネットワークライブラリ『NNabla』

UnityでLight Shaftを表現する

RefineNet (Multi-Path Refinement Network):ディープラーニン...

SSD (Single Shot Multibox Detector):ディープラーニングによる一般...

Math Inspector:科学計算向けビジュアルプログラミングツール

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

Seleniumを使ったFXや株の自動取引

Rerun:マルチモーダルデータの可視化アプリとSDK

Konashiを買った

SSII2014 チュートリアル講演会の資料

Theia:オープンソースのStructure from Motionライブラリ

映画から想像するVR・AR時代のGUIデザイン

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

コメント