第25回コンピュータビジョン勉強会@関東に行って来た

第25回コンピュータビジョン勉強会@関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、3次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

「Point Cloud Libraryの基本 + なぜ3D点群処理か?」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
「Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョン ブログ & メルマガポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。


ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ

関連記事

Blendify:コンピュータービジョン向けBlenderラッパー

Runway ML:クリエイターのための機械学習ツール

SDカードサイズのコンピューター『Intel Edison』

OpenCV

Regard3D:オープンソースのStructure from Motionツール

Cartographer:オープンソースのSLAMライブラリ

Super Resolution:OpenCVの超解像処理モジュール

OpenCVの三角測量関数『cv::triangulatepoints』

SSII2014 チュートリアル講演会の資料

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

bpy-renderer:レンダリング用Pythonパッケージ

Qlone:スマホのカメラで3Dスキャンできるアプリ

OpenCVの超解像(SuperResolution)モジュールを試す

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

ポイントクラウドコンソーシアム

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

TorchStudio:PyTorchのための統合開発環境とエコシステム

UnityでPoint Cloudを表示する方法

GAN (Generative Adversarial Networks):敵対的生成ネットワーク

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

Kinect for Windows v2の日本価格決定

iPhoneで3D写真が撮れるアプリ『seene』

Googleが画像解析旅行ガイドアプリのJetpac社を買収

openMVGをWindows10 Visual Studio 2015環境でビルドする

海外ドラマのChromaKey

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

ニューラルネットワークと深層学習

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

NeRF (Neural Radiance Fields):深層学習による新規視点合成

OpenCVで顔のランドマークを検出する『Facemark API』

Fast R-CNN:ディープラーニングによる一般物体検出手法

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

スクラッチで既存のキャラクターを立体化したい

OpenCVで顔のモーフィングを実装する

OpenCV 3.1から追加されたSfMモジュール

Point Cloud Libraryに動画フォーマットが追加されるらしい

Theia:オープンソースのStructure from Motionライブラリ

Faster R-CNN:ディープラーニングによる一般物体検出手法

OpenCVの顔検出過程を可視化した動画

MVStudio:オープンソースのPhotogrammetryツール

コメント