set non-causal attention

2025-12-21 22:33:56 +00:00 · 2025-03-07 13:52:45 -08:00
parent 631fecc6d9
commit 0df1800436
6 changed files with 57 additions and 25 deletions
--- a/convert/convert_gemma3.go
+++ b/convert/convert_gemma3.go
@@ -58,9 +58,6 @@ func (p *gemma3Model) KV(t *Tokenizer) ggml.KV {
 	kv["gemma3.vision.num_channels"] = p.VisionModel.NumChannels
 	kv["gemma3.vision.attention.head_count"] = p.VisionModel.NumAttentionHeads
 	kv["gemma3.vision.attention.layer_norm_epsilon"] = p.VisionModel.LayerNormEpsilon
-
-	kv["tokenizer.ggml.bos_token_id"] = uint32(2)
-	kv["tokenizer.ggml.eot_token_id"] = uint32(1)
 	return kv
 }