第25回コンピュータビジョン勉強会@関東に行って来た

第25回コンピュータビジョン勉強会@関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、3次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

Point Cloud Libraryの基本 + なぜ3D点群処理か?」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョン ブログ & メルマガポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。


スポンサーリンク

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。


ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ


スポンサーリンク

関連記事

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ
Facebookの顔認証技術『DeepFace』
Googleが画像解析旅行ガイドアプリのJetpac社を買収
OpenCVで平均顔を作るチュートリアル
SegNet:ディープラーニングによるSemantic Segmentation手法
OpenCV
画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
BlenderでPhotogrammetryできるアドオン
画像処理を基礎から学べるキーエンスのサイト『画像道場』
OpenCV 3.1から追加されたSfMモジュール
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
OpenCV 3.3.0-RCでsfmモジュールをビルド
OpenCVの超解像(SuperResolution)モジュールを試す
OpenCVのバージョン3が正式リリースされたぞ
MeshroomでPhotogrammetry
OpenCVで顔のモーフィングを実装する
2D→3D復元技術で使われる用語まとめ
書籍『OpenCV 3 プログラミングブック』を購入
ポイントクラウドコンソーシアム
統計的な顔モデル
OpenGVのライブラリ構成
画像中の人物表面のUV座標を推定する『DensePose』
インタラクティブにComputer Visionコーディングができるツール『Live CV』
3Dコンピュータービジョンライブラリ『PyTorch3D』
UnityでOpenCVを使うには?
SSII2014 チュートリアル講演会の資料
複数視点画像から3次元形状を復元するライブラリ『openMVG』
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
OpenCVのための軽量GUIライブラリ『cvui』
OpenMVSのサンプルを動かしてみる
Structure from Motion (多視点画像からの3次元形状復元)
OpenCVで動画の手振れ補正
iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』
GoogleのDeep Learning論文
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
AfterEffectsプラグイン開発
Adobe MAX 2015
OpenCVの顔検出過程を可視化した動画
Point Cloud Libraryに動画フォーマットが追加されるらしい
GANs (Generative Adversarial Networks):敵対的生成ネットワーク
OpenGVの用語
RefineNet (Multi-Path Refinement Network):ディープラーニン...

コメント