第25回コンピュータビジョン勉強会@関東に行って来た

第25回コンピュータビジョン勉強会@関東に行って来た。この勉強会の存在自体は結構前から知っていて、Ustを見たりはしていたんだけど、第25回となる今回は、3次元計測・認識の話題。Point Cloud Library系な話が沢山聴けそうなので今回初めて参加してみた。
今回講演されたのは、以下の4つ。

Point Cloud Libraryの基本 + なぜ3D点群処理か?」@payashimさん
「三次元点群処理ライブラリPCLと統合ロボットシステム研究での利用例の紹介」@garaemon_coderさん
「RGBD画像処理と三次元物体認識」@kanejakiさん
Kinect v2の紹介」@UnaNancyOwenさん

オイラはDERiVE コンピュータビジョン ブログ & メルマガポイントクラウドコンソーシアムで御馴染みの@payashimさんと、Kinectの書籍で有名な@UnaNancyOwenさんの話を聴くのが目当てだったんだけど、ロボットビジョンを専門に研究されている@garaemon_coderさん@kanejakiさんによるロボットビジョンの視点からの話が新鮮だった。ロボットビジョンってそんなに進んでるのねっていう。


スポンサーリンク

加えて、ライトニングトークも行われた。
「iPhoneで奥行きを推定するプログラムを作りました」@ginrou799さん
「Kincet v2で遠隔じゃんけんをする」@fumito_itoさん

予想以上に濃い話が聞けた。PCLの使い方に関するちょっとした疑問には@takminさんが答えてくれるというステキな勉強会でした。オイラはPCLのply保存機能の存在を教えてもらいました。


ロボットビジョンでは3Dによる計測・認識が結構前から使われていて、kinect登場以前から、高価な3Dセンサーをロボットの目にする研究が行われていたらしい。そして、ロボットビジョン系の話は最先端過ぎてついて行けないレベルの話も多かったです(笑)

Point Cloud Libraryは開発環境の構築のハードルが高いことが結構大きな参入障壁で、以前オイラも1.71をビルドした時にライブラリの依存関係で結構苦しんだんだけど、最近は@UnaNancyOwenさんが率先してWindows用All in Oneインストーラを配布しているのでそのハードルは一気に下がった。ちなみにUbuntuだとaptコマンドでインストール可能らしい。

発表資料を後ほどネットにアップ予定の方も結構いらっしゃるので、のんびり復習しようと思う。
後半の2つ、「RGBD画像処理と三次元物体認識」と「Kinect v2の紹介」はUstのアーカイブで見返せます。

Broadcast live streaming video on Ustream

2014/10/04 CV勉強会ツイートまとめ


スポンサーリンク

関連記事

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
openMVGをWindows10 Visual Studio 2015環境でビルドする
Leap MotionでMaya上のオブジェクトを操作できるプラグイン
写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』
OpenMVSのサンプルを動かしてみる
OpenCV
hloc:SuperGlueで精度を向上させたSfM実装
画像からカメラの3次元位置・姿勢を推定するライブラリ『OpenGV』
Kinect for Windows v2の日本価格決定
PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...
SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
OpenCV バージョン4がリリースされた!
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
OpenGVの用語
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
Multi-View Stereoによる3次元復元ライブラリ『OpenMVS』
PGGAN:段階的に解像度を上げて学習を進めるGAN
Runway ML:クリエイターのための機械学習ツール
DensePose:画像中の人物表面のUV座標を推定する
Photogrammetry (写真測量法)
ニューラルネットワークと深層学習
池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』
OpenCVでiPhone6sのカメラをキャリブレーションする
takminさんが機械学習・画像認識の便利ツールを公開しています
CycleGAN:ドメイン関係を学習した画像変換
PyTorch3D:3Dコンピュータービジョンライブラリ
Cartographer:オープンソースのSLAMライブラリ
3D復元技術の情報リンク集
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
第1回 3D勉強会@関東『SLAMチュートリアル大会』
GAN (Generative Adversarial Networks):敵対的生成ネットワーク
iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』
AR (Augmented Reality)とDR (Diminished Reality)
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
MVStudio:オープンソースのPhotogrammetryツール
Googleが画像解析旅行ガイドアプリのJetpac社を買収
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
機械学習について最近知った情報
Autodesk Mementoでゴジラを3次元復元する
OpenSfM:PythonのStructure from Motionライブラリ
読みやすくて高速なディープラーニングのフレームワーク『Caffe』
UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン

コメント