第25回コンピュータビジョン勉強会＠関東に行って来た

第25回コンピュータビジョン勉強会＠関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、３次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

「Point Cloud Libraryの基本 + なぜ3D点群処理か？」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
「Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョンブログ & メルマガやポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん、@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。

@NegativeMind PCLでply形式で保存すればよいです。

— Minagawa Takuya (高度でないAI人材) (@takmin) October 4, 2014

ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

PCLはubuntuだとaptでいれられるよ! #cvsaisentan

— がらえもん (@garaemon) October 4, 2014

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ

20141004cvsaisentan_PCL_and_why_3D_vision?? from Masaki Hayashi

三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介 from Ryohei Ueda

cvsaisentan20141004 kanezaki from kanejaki

Introduction to Kinect v2 from Tsukasa Sugiura

Depth From Sequence from Yuichi Takeda

TensorFlowでCGを微分できる『TensorFlow Graphics』

Live CV：インタラクティブにComputer Visionコーディングができるツール

OpenCVの顔検出過程を可視化した動画

Blendify：コンピュータービジョン向けBlenderラッパー

OpenCV 3.3.0-RCでsfmモジュールをビルド

2D→3D復元技術で使われる用語まとめ

viser：Pythonで使える3D可視化ライブラリ

AR (Augmented Reality)とDR (Diminished Reality)

OpenCVで動画の手ぶれ補正

Kinect for Windows V2のプレオーダー開始

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

関連記事

TensorFlowでCGを微分できる『TensorFlow Graphics』

Live CV：インタラクティブにComputer Visionコーディングができるツール

OpenCVの顔検出過程を可視化した動画

Blendify：コンピュータービジョン向けBlenderラッパー

﻿OpenCV 3.3.0-RCでsfmモジュールをビルド

2D→3D復元技術で使われる用語まとめ

viser：Pythonで使える3D可視化ライブラリ

AR (Augmented Reality)とDR (Diminished Reality)

OpenCVで動画の手ぶれ補正

Kinect for Windows V2のプレオーダー開始

BlenderProc：Blenderで機械学習用の画像データを生成するPythonツール

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

顔追跡による擬似3D表示『Dynamic Perspective』

CGAN (Conditional GAN)：条件付き敵対的生成ネットワーク

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

TorchStudio：PyTorchのための統合開発環境とエコシステム

UnityでPoint Cloudを表示する方法

Iridescence：プロトタイピング向け軽量3D可視化ライブラリ

cvui：OpenCVのための軽量GUIライブラリ

FreeMoCap Project：オープンソースのマーカーレスモーションキャプチャ

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

顔画像処理技術の過去の研究

SegNet：ディープラーニングによるSemantic Segmentation手法

DensePose：画像中の人物表面のUV座標を推定する

今年もSSII

Paul Debevec

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

PeopleSansPeople：機械学習用の人物データをUnityで生成する

PGGAN：段階的に解像度を上げて学習を進めるGAN

Point Cloud Libraryに動画フォーマットが追加されるらしい

統計的な顔モデル

Super Resolution：OpenCVの超解像処理モジュール

openMVG：複数視点画像から3次元形状を復元するライブラリ

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ

OpenCVで顔のモーフィングを実装する

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

Active Appearance Models（AAM）

ArUco：OpenCVベースのコンパクトなARライブラリ

Google Colaboratoryで遊ぶ準備

オープンソースの顔の動作解析ツールキット『OpenFace』

コメント

個人情報に関するお知らせ

OpenCV 3.3.0-RCでsfmモジュールをビルド