SSII(Symposium on Sensing via Image Information) 2015が始まりました。なんだかんだで、オイラはSSIIの聴講が3回目になる。今回も、1日目は大変有難いチュートリアル講演会だった。
SSII2015 チュートリアル講演会
ハッシングによる効率的な大規模画像検索
-近似近傍探索の新たなスタンダード-講師:入江豪氏(NTT)
Deep Learningによる画像認識革命-歴史・最新理論から実践応用までー
講師:中山英樹氏(東京大学)
特徴点追跡による動画像からの逐次3次元復元とその応用-座標系の基礎から応用事例・最新研究動向まで-
講師:佐藤智和氏(奈良先端科学技術大学院大学)
コンピュータビジョンの最新ソフトウェア開発環境-OpenCV,PCLの導入・機能紹介。プログラミング言語の選択と開発ツールの活用-
講師:林昌希氏(慶應義塾大学)
スポンサーリンク
個人的に1番興味があったのは「特徴点追跡による動画像からの逐次3次元復元とその応用」、つまりvisual-SLAMの話。Structure From Motionが「オフラインで時間をかけて精度の高い3次元復元を行う」のに対して、SLAMは「リアルタイムでそこそこの3次元情報を復元する」という位置づけらしい。
このセッションの中で仮想物体を現実の風景に重畳する「拡張現実感」(AR:Augmented Reality)に対して、現実の風景から仮想的に実在する物体を消して見せる「隠消現実感」(DR:Diminished Reality)という概念があることを初めて知った。
こちらはリアルタイムに実物体を除去するデモ。↓
こういうのって、リアルタイムにできちゃうもんなのね。
v-SLAM系の話を聞いていると、オープンソースで相当色んなことができる時代であることを実感する。
そしてそして、DERiVE コンピュータビジョン ブログ & メルマガやポイントクラウドコンソーシアムでお馴染みの最後のセッションで印象的だったのが後半のプログラミング言語と研究開発環境の話。1度会社員としてソフトウェア開発に従事した経験を持つ林さんならではの問題提起だなぁ、と。
オイラも似たような悩みというか、バランスをどう取るべきか試行錯誤中。以前も書いたけど、会社員としてソフトウェア開発のプロトタイピングをする時には、あんまりオレオレコード全開で突き進むと後々困るけど、キッチリ設計に時間をかけ過ぎても良くない。自分の頭は帰納的か、演繹的かどちらの傾向が強いだろうか。
スポンサーリンク
ところで、前々から思ってたんだけど、林さんってヤムチャ(というか古谷徹)の声真似上手そう。(どうでもいい)
会場では書籍「ディジタル画像処理」と「コンピュータグラフィックス」の改訂版がそれぞれ17%, 15%割引で販売されていた。内容が大幅に改定・追加されている様子。
スポンサーリンク
関連記事
クラスの基本
Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方
Meta Quest 3を購入!
Deep Fluids:流体シミュレーションをディープラーニングで近似する
池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』
Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法
ニューラルネットワークと深層学習
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
Google Colaboratoryで遊ぶ準備
Digital Emily Project:人間の顔をそっくりそのままCGで復元する
OpenCVでPhotoshopのプラグイン開発
MVStudio:オープンソースのPhotogrammetryツール
UnityのTransformクラスについて調べてみた
ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...
AR (Augmented Reality)とDR (Diminished Reality)
PSPNet (Pyramid Scene Parsing Network):ディープラーニングによ...
HerokuでMEAN stack
WordPressの表示を高速化する
Theia:オープンソースのStructure from Motionライブラリ
TorchStudio:PyTorchのための統合開発環境とエコシステム
ManimML:機械学習の概念を視覚的に説明するためのライブラリ
SegNet:ディープラーニングによるSemantic Segmentation手法
OpenCV 3.1から追加されたSfMモジュール
ROMOハッカソンに行ってきた
Unityで強化学習できる『Unity ML-Agents』
Active Appearance Models(AAM)
オーバーロードとオーバーライド
GoB:ZBrushとBlenderを連携させるアドオン
『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた
書籍『ゼロから作るDeep Learning』で自分なりに学ぶ
Rerun:マルチモーダルデータの可視化アプリとSDK
書籍『イラストで学ぶ ディープラーニング』
Kinect for Windows V2のプレオーダー開始
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
Raspberry PiでIoTごっこ
Model View Controller
UnityのAR FoundationでARKit 3
Mechanizeで要認証Webサイトをスクレイピング
geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ
オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート
Python拡張モジュールのWindows用インストーラー配布サイト
コメント