Transformer2
https://arxiv.org/abs/2501.06252
Transformer2: Self-adaptive LLMs
https://sakana.ai/transformer-squared/
blog
https://gyazo.com/9d04fa694e86a89d4451747a4e8efe93
自己適応型LLM
モデルがタスクに応じて重みを動的に調整し、最適な結果を生成
Transformer²は、さまざまなタスク(数学、コーディング、推論、視覚的理解など)で大幅な進歩を示しており、
LoRA
のような従来の静的アプローチよりも効率とタスク固有のパフォーマンスを上回り、必要なパラメータがはるかに少なくて済みます。
#sakana.ai