.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

第25回コンピュータビジョン勉強会＠関東に行って来た

NegativeMind

10年前

第25回コンピュータビジョン勉強会＠関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、３次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

「Point Cloud Libraryの基本 + なぜ3D点群処理か？」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
「Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョンブログ & メルマガやポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん、@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。

@NegativeMind PCLでply形式で保存すればよいです。

— Minagawa Takuya (高度でないAI人材) (@takmin) October 4, 2014

ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

PCLはubuntuだとaptでいれられるよ! #cvsaisentan

— がらえもん (@garaemon) October 4, 2014

スポンサーリンク

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ

20141004cvsaisentan_PCL_and_why_3D_vision?? from Masaki Hayashi

三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介 from Ryohei Ueda

cvsaisentan20141004 kanezaki from kanejaki

Introduction to Kinect v2 from Tsukasa Sugiura

Depth From Sequence from Yuichi Takeda

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

スクラッチで既存のキャラクターを立体化したい

Iridescence：プロトタイピング向け軽量3D可視化ライブラリ

Open3D：3Dデータ処理ライブラリ

ポイントクラウドコンソーシアム

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

関連記事

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

スクラッチで既存のキャラクターを立体化したい

Iridescence：プロトタイピング向け軽量3D可視化ライブラリ

Open3D：3Dデータ処理ライブラリ

ポイントクラウドコンソーシアム

GAN (Generative Adversarial Networks)：敵対的生成ネットワーク

fSpy：1枚の写真からカメラパラメーターを割り出すツール

Multi-View Environment：複数画像から3次元形状を再構築するライブラリ

続・ディープラーニングの資料

UnrealCV：コンピュータビジョン研究のためのUnreal Engineプラグイン

UnityでOpenCVを使うには？

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

iPhoneで3D写真が撮れるアプリ『seene』

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか

iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』

画像生成AI Stable Diffusionで遊ぶ

顔画像処理技術の過去の研究

hloc：SuperGlueで精度を向上させたSfM実装

OpenSfM：PythonのStructure from Motionライブラリ

TeleSculptor：空撮動画からPhotogrammetryするツール

ニューラルネットワークと深層学習

COLMAP：オープンソースのSfM・MVSツール

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

3Dスキャンに基づくプロシージャルフェイシャルアニメーション

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

OpenGVの用語

Structure from Motion (多視点画像からの3次元形状復元)

Active Appearance Models（AAM）

OpenCVで平均顔を作るチュートリアル

OpenCV バージョン4がリリースされた！

openMVG：複数視点画像から3次元形状を復元するライブラリ

DCGAN (Deep Convolutional GAN)：畳み込みニューラルネットワークによる敵...

OpenCVで顔のモーフィングを実装する

オープンソースの顔の動作解析ツールキット『OpenFace』

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

MeshroomでPhotogrammetry

書籍『イラストで学ぶ ディープラーニング』

DensePose：画像中の人物表面のUV座標を推定する

Autodesk Mementoでゴジラを3次元復元する

書籍『OpenCV 3 プログラミングブック』を購入

ニューラルネットワークで画像分類

Accord.NET Framework：C#で使える機械学習ライブラリ

書籍『イラストで学ぶディープラーニング』