3D Vision

CG

VGGT:マルチビュー・フィードフォワード型3Dビジョン基盤モデル

個人的に3Dビジョンの基盤モデルの動向に注目している。複数枚の画像からシーンの立体構造やカメラ情報を復元する3D Reconstruction(3次元再構成)は、3Dコンピュータービジョンの根幹となる技術。近年はDUSt3Rのようにディープ...
0
CG

DUSt3R:3Dコンピュータービジョンの基盤モデル

機械学習分野では、世間的にも話題のLLM(Large Language Model)をはじめ、多様な大量のデータでニューラルネットワークを事前学習(Pre-training)した基盤モデル(Foundation Model)が様々な下流タス...
0
NegativeMindをフォローする