self-attention

CG

VGGT: Visual Geometry Grounded Transformer

個人的に3Dビジョンの基盤モデルの動向に注目している。複数枚の画像からシーンの立体構造やカメラ情報を復元する3D Reconstruction(3次元再構成)は、3Dコンピュータービジョンの根幹となる技術。近年はDUSt3Rのようにディープ...
0
NegativeMindをフォローする