self-attention

VGGT：マルチビュー・フィードフォワード型3Dビジョン基盤モデル

個人的に3Dビジョンの基盤モデルの動向に注目している。複数枚の画像からシーンの立体構造やカメラ情報を復元する3D Reconstruction(3次元再構成)は、3Dコンピュータービジョンの根幹となる技術。近年はDUSt3Rのようにディープ...

2025.12.25 2026.01.15 0

CGComputer Vision