第25回コンピュータビジョン勉強会@関東に行って来た

第25回コンピュータビジョン勉強会@関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、3次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

Point Cloud Libraryの基本 + なぜ3D点群処理か?」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョン ブログ & メルマガポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。


ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ

関連記事

PeopleSansPeople:機械学習用の人物データをUnityで生成する

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Kornia:微分可能なコンピュータービジョンライブラリ

Qlone:スマホのカメラで3Dスキャンできるアプリ

書籍『OpenCV 3 プログラミングブック』を購入

openMVGをWindows10 Visual Studio 2015環境でビルドする

OpenCV3.3.0でsfmモジュールのビルドに成功!

コンピュータビジョンの技術マップ

Kubric:機械学習用アノテーション付き動画生成パイプライン

UnityでPoint Cloudを表示する方法

fSpy:1枚の写真からカメラパラメーターを割り出すツール

画像生成AI Stable Diffusionで遊ぶ

ベイズ推定とグラフィカルモデル

顔画像処理技術の過去の研究

OpenCV 3.1から追加されたSfMモジュール

機械学習について最近知った情報

Photogrammetry (写真測量法)

PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...

TorchStudio:PyTorchのための統合開発環境とエコシステム

GoogleのDeep Learning論文

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

Structure from Motion (多視点画像からの3次元形状復元)

iPhoneで3D写真が撮れるアプリ『seene』

Active Appearance Models(AAM)

Regard3D:オープンソースのStructure from Motionツール

MeshroomでPhotogrammetry

Iridescence:プロトタイピング向け軽量3D可視化ライブラリ

Alice Vision:オープンソースのPhotogrammetryフレームワーク

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

Autodesk Mementoでゴジラを3次元復元する

NeRF (Neural Radiance Fields):深層学習による新規視点合成

FCN (Fully Convolutional Network):ディープラーニングによるSema...

Theia:オープンソースのStructure from Motionライブラリ

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

DensePose:画像中の人物表面のUV座標を推定する

COLMAP:オープンソースのSfM・MVSツール

海外ドラマのChromaKey

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

SegNet:ディープラーニングによるSemantic Segmentation手法

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

CGのためのディープラーニング

コメント