DensePose：画像中の人物表面のUV座標を推定する

カーネギーメロン大学が公開している2D画像からの人体骨格推定ライブラリOpenPoseの元の研究である”Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields“が発表されて以降、2D画像・動画からの骨格推定の研究とソースコードの公開が活発な印象。

DensePoseは、骨格ではなく、動画中の人物領域の3DサーフェスのUV座標を推定するという、とても具体的なタスクの研究。面白そうなので論文がarXivに公開されてからすぐに読んだのでした。
ただ、CGに詳しくない人には課題設定がピンと来ないんじゃないかな。

DensePose: Dense Human Pose Estimation In The Wild

Dense human pose estimation(密な人体姿勢推定)は、画像中の人物のRGB画素全てを3Dの人体サーフェスへマッピングすることを目的としています。

5万枚のCOCOデータセットの画像に対して人力で2D画像と3Dサーフェスの対応関係をアノテーションした大規模なground-truthデータセット「DensePose-COCO」を提案します。

Mask-RCNNを改良し、動画の毎秒複数フレームに写るそれぞれの人物領域の各人体パーツのUV座標を密に回帰推定する「DensePose-RCNN」を提案します。

DensePose-COCOデータセットも公開予定だそうです。
https://github.com/arXivTimes/arXivTimes/issues/638

ソースコードがGitHubで公開されましたね↓
https://github.com/facebookresearch/DensePose

Dockerfileもあるので試すのは楽か？
2018年12月追記：試した方がいます↓
http://whoopsidaisies.hatenablog.com/entry/2018/12/03/193759

これって、顔画像で言うところのFace Alignmentに近い役割ができて、Body Alignmentって言っても良さそう。
画像中から人物表面のUV座標が推定できれば、身体の模様(つまり服装)を比べたり、入れ替えたり、描き替えたりできるんですよね。

著者にFacebook AI Researchの人が2人入ってるけど、やっぱり目指すのは画像からの個人識別なんですかね。
https://research.fb.com/facebook-open-sources-densepose/
https://shiropen.com/seamless/facebook-ai-densepose

論文では、データセットを作るためのアノテーションツールを設計と、アノテーションの質の評価についても載っている。

ちゃんと解きたいタスクに適したデータセットを用意して、タスクに適したネットワークを設計する、ってのが機械学習の良いアプローチなのだろうか。
機械学習でOverfitting(過学習)と呼ばれる現象は、データセットとタスクのギャップと言えるのかもしれない。

2019年追記：最近はRunway MLというツールで手軽にDensePoseを試すことができるぞ↓

Runway ML：クリエイターのための機械学習ツール

表現のための機械学習(というかディープラーニング)がじわじわと来ている、と勝手に思っている。実際、グラフィックス系のカンファレンスでもディープラーニングのセッションが大盛況だし。クリエイターが機械学習の恩恵を受けられるアプリケーションは、A...

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

2012 昨日のクローズアップ現代を見た

TensorSpace.js：ニューラルネットワークの構造を可視化するフレームワーク

OpenGVのライブラリ構成

Verilog HDL

Python.NET：Pythonと.NETを連携させるパッケージ

Boost オープンソースライブラリ

第20回文化庁メディア芸術祭『3DCG表現と特撮の時代』

Photogrammetry (写真測量法)

Adobe Photoshop CS4 Extendedの3Dモデル編集機能

Vancouver Film Schoolのデモリール

手を動かしながら学ぶデータマイニング

ZBrushのTranspose Masterでポーズを付ける

トランスフォーマーの変形パターンを覚えるのは楽しいと思うんだ

Mean Stack開発の最初の一歩

Amazon Web ServicesでWordPress

フルCGのウルトラマン！？

fSpy：1枚の写真からカメラパラメーターを割り出すツール

Unite 2014の動画

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

Autodesk CompositeとAutodesk MatchMoverが無料

統計的な顔モデル

Unityの薄い本

フォトンの放射から格納までを可視化した動画

タダでRenderManを体験する方法

ZBrushCore

MeshLab：3Dオブジェクトの確認・変換に便利なフリーウェア

このブログのデザインに飽きてきた

ZBrushでアヴァン・ガメラを作ってみるおでこ(？)のバランス調整

機械学習で遊ぶ

『ハン・ソロ/スター・ウォーズ・ストーリー』のVFXブレイクダウンまとめ

WordPressのテーマを自作する

ZBrushでアヴァン・ガメラを作ってみる甲羅の修正・脚の作り込み

DensePose: Dense Human Pose Estimation In The Wild

関連記事

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

2012 昨日のクローズアップ現代を見た

TensorSpace.js：ニューラルネットワークの構造を可視化するフレームワーク

OpenGVのライブラリ構成

Verilog HDL

Python.NET：Pythonと.NETを連携させるパッケージ

Boost オープンソースライブラリ

第20回 文化庁メディア芸術祭『3DCG表現と特撮の時代』

Photogrammetry (写真測量法)

Adobe Photoshop CS4 Extendedの3Dモデル編集機能

Vancouver Film Schoolのデモリール

手を動かしながら学ぶデータマイニング

ZBrushのTranspose Masterでポーズを付ける

トランスフォーマーの変形パターンを覚えるのは楽しいと思うんだ

Mean Stack開発の最初の一歩

Amazon Web ServicesでWordPress

フルCGのウルトラマン！？

fSpy：1枚の写真からカメラパラメーターを割り出すツール

Unite 2014の動画

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

Autodesk CompositeとAutodesk MatchMoverが無料

統計的な顔モデル

Unityの薄い本

フォトンの放射から格納までを可視化した動画

タダでRenderManを体験する方法

ZBrushCore

MeshLab：3Dオブジェクトの確認・変換に便利なフリーウェア

このブログのデザインに飽きてきた

ZBrushでアヴァン・ガメラを作ってみる おでこ(？)のバランス調整

機械学習で遊ぶ

『ハン・ソロ/スター・ウォーズ・ストーリー』のVFXブレイクダウン まとめ

WordPressのテーマを自作する

ZBrushでアヴァン・ガメラを作ってみる 甲羅の修正・脚の作り込み

ZBrushで仮面ライダー3号を造る 仮面編 PolyGroupを分割する

OpenMayaのPhongShaderクラス

FCN (Fully Convolutional Network)：ディープラーニングによるSema...

CGALDotNet：計算幾何学ライブラリ CGALのC#ラッパー

ZBrushでアヴァン・ガメラを作ってみる 脚のトゲの作り直し

昔Mayaでモデリングしたモデルをリファインしてみようか

ゴジラ三昧

Google App Engine上のWordPressでFlickrの画像を貼る

Mayaのシェーディングノードの区分

コメント

個人情報に関するお知らせ

第20回文化庁メディア芸術祭『3DCG表現と特撮の時代』

ZBrushでアヴァン・ガメラを作ってみるおでこ(？)のバランス調整

『ハン・ソロ/スター・ウォーズ・ストーリー』のVFXブレイクダウンまとめ

ZBrushでアヴァン・ガメラを作ってみる甲羅の修正・脚の作り込み

ZBrushで仮面ライダー3号を造る仮面編 PolyGroupを分割する

ZBrushでアヴァン・ガメラを作ってみる脚のトゲの作り直し