AR (Augmented Reality)とDR (Diminished Reality)

最近、UnityのAR Foundation経由でiOSのARKit 3遊びをしていますが、



昨年、書店で「ARの教科書」を立ち読みして、思いの外しっかりした内容だったので購入したのでした。

ARの教科書

https://book.mynavi.jp/ec/products/detail/id=91748

随分ストレートなタイトルなので、世に沢山あるようなプログラミングの入門書みたいなものかと思ったら、割とアカデミックな洋書の翻訳本なんですね。
原著は2016年に出版された”Augmented Reality: Principles and Practice“で、2人の著者はどちらもARを研究する大学教授だ。

書籍のサポートサイトもある↓
https://sites.google.com/view/ar-textbook/

チュートリアル動画↓

Augmented Reality – Principles and Practice Workshop (Part 1)

Augmented Reality – Principles and Practice Workshop (Part 2)

xR Tech Tokyoで輪講会もあったね。
https://www.godis1st.net/2018/12/ar.html


スポンサーリンク


本書の冒頭で書かれている通り、ARは複数の研究分野(主にCGとCV)が複合的に絡み合って発展したため、ARの文脈で理論と実装をバランス良く体系的にまとめた教科書的な書物が長らく存在しなかった。
実装面において、ARは既存の技術分野を横断した開発知識が必要だが、その一方で、AR体験を設計するには人間の知覚についても理解が必要だ。
未来を見据えた理想的なビジョンを描くのも大事だが、優れたAR体験を実装するには、今現在の技術的制約と人間の知覚特性のバランスを取って体験を設計(モデル化)できなければならない。

本書の原題にある”Principles and Practice“は日本語で言うと「原理と実践」ということで、まずARという概念の定義、感覚を提示する手段(ディスプレイ)について視覚に限らず音声、触覚、嗅覚・味覚なども紹介した後、最も盛んに実装されている視覚系のARを実現するための画像認識、コンピューターグラフィックスの技術、アプリケーション設計について概観できる構成になっている。

ARのための画像認識

思えば、ARという言葉が一般に浸透してだいぶ経つ。
ARToolKit全盛の時代はデフォルトのARマーカー「Hiro」をよく見かけた。ARマーカー独特の意匠がARというジャンルのシンボルマーク、アフォーダンスとして機能していた時代があった。

現在この手の矩形マーカーはARコンテンツ向けというより、カメラ画像からの堅牢な位置測位・トラッキングのための手段として定着した気がする。



ハリウッド映画のメイキングで、俳優の演技をキャプチャするためのスーツにマーカーがたくさん貼り付けられている。
映画『ミュータント・タートルズ』を観てきた
ガメラからの亀つながりというわけではないけど、実写版のミュータント・タートルズをIMAX3Dで観てきた。「実写版」と言っても、過去に着ぐるみで撮られた実写映画が3作もある。今回のは「CGで実写化したやつ」とでも呼ぶべきか。2007年...


一目でマーカーだと分かる矩形のARマーカーに対して、その後明示的なマーカーを使わずに自然特徴量だけで位置測位・トラッキングを行う手法も登場した。

スマートフォンの時代になり、ここ最近はカメラ位置のトラッキングに撮影画像だけでなくスマホのモーションセンサーも併用するVIO(visual-inertial odometry)で実用面も一応一段落した感じ。(あくまでエンタメ用途のARでは)

Occlusion

今ARの実装でホットな技術課題はOcclusionのようだ。現実のオブジェクトよりも後ろにあるCGオブジェクトは遮蔽されるはず。この現実のオブジェクトとCGオブジェクト表示の前後関係の矛盾をどう解決するか。
アプローチとしては、単眼カメラ動画からDepth Mapを推定したり、もっと大雑把に前後フレームの視差から物体の境界書き割りを推定したり、あるいはSemantic Segmentationで特定の物体についての境界を推定したり。
ここでも機械学習ベースの手法が盛んに研究されている。

Siggraph Asia 2018では、同じセッションでFacebookとGoogleが別々のアプローチでARのOcclusion問題を解決する手法を発表していた。


スポンサーリンク

Facebook

Facebookの研究の方はソースコードも含めてネットで無料公開されている↓
https://homes.cs.washington.edu/~holynski/publications/occlusion/index.html
https://github.com/facebookresearch/AR-Depth

Fast Depth Densification for Occlusion-aware Augmented Reality (Teaser)

Niantic

ポケモンGOの開発元で知られるNianticもOcclusion問題に取り組んでいる。
https://nianticlabs.com/ja/blog/nianticrealworldplatform/

Codename: Niantic Occlusion – Real World AR Occlusion featuring Pikachu and Eevee

Niantic LabsとしてDepth推定の論文を発表し、ソースコードも公開している↓
https://arxiv.org/abs/1806.01260
https://github.com/nianticlabs/monodepth2

Digging Into Self-Supervised Monocular Depth Estimation

PoepleOcclusion

オイラが最近遊んでいるiOSのARKit3では、人物領域をSegmentationすることで現実空間の人とCGオブジェクトの重なりを解決するもの。

オイラもこの記事を参考にPoepleOcclusionを試してみた↓



顔が判別できるほど大きく写っている人物に対してはちゃんとSegmentationがかかる。ARで問題となるのは特に手前の物体によるOcclusionなので、これで十分。要件の落としどころが上手い。

DR (Diminished Reality)

現実空間に架空のオブジェクトなどを配置するAR: Augmented Reality(拡張現実感)に対して、オイラが個人的に注目しているのは、現実空間からオブジェクトを消して見せるDR: Diminished Reality(隠消現実感)と呼ばれる概念。

ARが情報の足し算だとすると、DRは情報の引き算と言える。

その概念を初めて知ったのは2015年のSSIIだった↓



あれから4年経って、面白い実装例が増えてきた↓



http://harrischris.com/article/biophillic-vision-experiment-1

Deep Learningで特定の物体領域を検出する精度が上がったから、次の課題はその領域をどうやって加工するかだ。



ARKit 3のPeopleOcclusionはDRの実装にも利用できるね↓



スポンサーリンク

関連記事

2016年の振り返り
PS3用ソフト『ゴジラ-GODZILLA-』を買った
『電光超人グリッドマン』のBlu-ray BOXが12月20日発売予定
続・ディープラーニングの資料
写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』
MRenderUtil::raytrace
色んな三面図があるサイト
『きたぞ!われらのウルトラマン』を観てきた
Adobe Photoshop CS5の新機能
プロシージャル手法に特化した本が出てるみたい(まだ買わないけど)
U-Net:ディープラーニングによるSemantic Segmentation手法
Unite 2014の動画
企画とエンジニア 時間感覚の違い
Unreal Engineの薄い本
TensorFlowでCGを微分できる『TensorFlow Graphics』
UnityでPoint Cloudを表示する方法
OpenCVでカメラ画像から自己位置認識 (Visual Odometry)
Unityからkonashiをコントロールする
『スター・ウォーズ フォースの覚醒』のVFXブレイクダウン まとめ
ゴジラ三昧
日立のフルパララックス立体ディスプレイ
Googleが画像解析旅行ガイドアプリのJetpac社を買収
グローバルイルミネーションに手を出す前に、やり残したことがあるんじゃない?
『ハン・ソロ/スター・ウォーズ・ストーリー』のVFXブレイクダウン まとめ
UnityでOpenCVを使うには?
3Dデータ処理ライブラリ『Open3D』
Adobe MAX 2015
3Dボリュームデータ処理ライブラリ『OpenVDB』
OpenCVで平均顔を作るチュートリアル
顔追跡による擬似3D表示『Dynamic Perspective』
ラクガキの立体化 進捗
トランスフォーマー :リベンジのメイキング (デジタルドメイン)
UnityのuGUIチュートリアル
複数画像から3次元形状を再構築するライブラリ『Multi-View Environment』
リメイク版ロボコップスーツのメイキング
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
ポイントクラウドコンソーシアム
調べものは得意なのかもしれない
映画から想像するVR・AR時代のGUIデザイン
『ローグ・ワン/スター・ウォーズ・ストーリー』のVFXブレイクダウン まとめ
Unityの各コンポーネント間でのやり取り
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

コメント