第25回コンピュータビジョン勉強会＠関東に行って来た

第25回コンピュータビジョン勉強会＠関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、３次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

「Point Cloud Libraryの基本 + なぜ3D点群処理か？」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
「Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョンブログ & メルマガやポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん、@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。

@NegativeMind PCLでply形式で保存すればよいです。

— Minagawa Takuya (高度でないAI人材) (@takmin) October 4, 2014

ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

PCLはubuntuだとaptでいれられるよ! #cvsaisentan

— がらえもん (@garaemon) October 4, 2014

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ

20141004cvsaisentan_PCL_and_why_3D_vision?? from Masaki Hayashi

三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介 from Ryohei Ueda

cvsaisentan20141004 kanezaki from kanejaki

Introduction to Kinect v2 from Tsukasa Sugiura

Depth From Sequence from Yuichi Takeda

ニューラルネットワークで画像分類

機械学習手法『Random Forest』

書籍『OpenCV 3 プログラミングブック』を購入

Composition Rendering：Blenderに...

スクラッチで既存のキャラクターを立体化したい

オープンソースのロボットアプリケーションフレームワーク『RO...

Kinect for Windows v2の日本価格決定

openMVGをWindows10 Visual Studi...

写真に3Dオブジェクトを違和感無く合成する『3DPhotoM...

CNN Explainer：畳み込みニューラルネットワーク可...

GAN (Generative Adversarial Ne...

OpenCVの顔検出過程を可視化した動画

PSPNet (Pyramid Scene Parsing ...

Digital Emily Project：人間の顔をそっく...

MeshroomでPhotogrammetry

PGGAN：段階的に解像度を上げて学習を進めるGAN

OpenAR：OpenCVベースのマーカーARライブラリ

OpenCV3.3.0でsfmモジュールのビルドに成功！

RefineNet (Multi-Path Refineme...

Qlone：スマホのカメラで3Dスキャンできるアプリ

ベイズ推定とグラフィカルモデル

Faceshiftで表情をキャプチャしてBlender上でM...

Fast R-CNN：ディープラーニングによる一般物体検出手...

Googleが画像解析旅行ガイドアプリのJetpac社を買収

openMVG：複数視点画像から3次元形状を復元するライブラ...

Caffe：読みやすくて高速なディープラーニングのフレームワ...

fSpy：1枚の写真からカメラパラメーターを割り出すツール

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...

iPhoneで3D写真が撮れるアプリ『seene』

CycleGAN：ドメイン関係を学習した画像変換

OpenFace：Deep Neural Networkによ...

畳み込みニューラルネットワーク (CNN: Convolut...

画像認識による位置情報取得 - Semi-Direct Mo...

Kornia：微分可能なコンピュータービジョンライブラリ

オープンソースの顔認識フレームワーク『OpenBR』

OpenCV

オープンソースの顔の動作解析ツールキット『OpenFace』

FacebookがDeep learningツールの一部をオ...

DensePose：画像中の人物表面のUV座標を推定する

SSD (Single Shot Multibox Dete...

Theia：オープンソースのStructure from M...

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

第25回コンピュータビジョン勉強会＠関東に行って来た

関連記事

コメント

関連記事

コメント

個人情報に関するお知らせ