Llama2 - 🍣YuWd(和田唯我)のメモ🍣

Llama2

#memo

https://ai.plainenglish.io/understanding-llama2-kv-cache-grouped-query-attention-rotary-embedding-and-more-c17e5f49a6d7