Data
調べたり、集めたりしたデータです。
LLM KV Cache Sizing
updated: 2025-05-15
この記事に従って、LLMのKV Cacheのサイズを試算しました。 あくまで机上の計算なので、実際のサイズとは異なる場合があります。
google/gemma-3-12b-it
記号 | 値 |
---|---|
2 | 2 |
B | 1 (とする) |
bytes/param | 2 (16 bit) |
nlayers | 48 |
nkv_attention_heads | 8 |
dattention_heads | 3840 // 16 = 240 |
context_length | 32k (とする) |
KV Cache サイズ | 11GB |
google/gemma-3-12b-it (config.json)
google/gemma-3-27b-it
記号 | 値 |
---|---|
2 | 2 |
B | 1 (とする) |
bytes/param | 2 (16 bit) |
nlayers | 62 |
nkv_attention_heads | 16 |
dattention_heads | 5376 // 32 = 168 |
context_length | 32k (とする) |
KV Cache サイズ | 19.9GB |
google/gemma-3-27b-it (config.json)
Qwen/Qwen3-32B
記号 | 値 |
---|---|
2 | 2 |
B | 1 (とする) |
bytes/param | 2 (16 bit) |
nlayers | 64 |
nkv_attention_heads | 8 |
dattention_heads | 5120 // 64 = 80 |
context_length | 32k (とする) |
KV Cache サイズ | 4.9GB |
meta-llama/Llama-4-Scout-17B-16E-Instruct
記号 | 値 |
---|---|
2 | 2 |
B | 1 (とする) |
bytes/param | 2 (16 bit) |
nlayers | 48 |
nkv_attention_heads | 8 |
dattention_heads | 5120 // 40 = 128 |
context_length | 32k (とする) |
KV Cache サイズ | 5.9GB |