Transformer

CG

DUSt3R:3Dコンピュータービジョンの基盤モデル

機械学習分野では、世間的にも話題のLLM(Large Language Model)をはじめ、多様な大量のデータでニューラルネットワークを事前学習(Pre-training)した基盤モデル(Foundation Model)が様々な下流タス...
0
Visualization

Transformer Explainer:テキスト生成モデルの可視化ツール

LLMの仕組みを可視化した教材というと、以前LLM Visualizationを紹介しましたがTransformer ExplainerはWebブラウザ上で実際にGPT-2を動作させてその仕組みを視覚的に確認できる↓Transformer ...
0
Visualization

LLM Visualization:大規模言語モデルの可視化

以前、ニューラルネットワークによる文字認識の仕組みを可視化した例をまとめたことがあったけどこちらはBrendan Bycroft氏による、昨今話題のLLM(大規模言語モデル)の仕組みを各プロセスの解説と共にビジュアルで理解できるWebページ...
0
NegativeMindをフォローする