feat: llama.cpp bump (17f7f4) for SSM performance improvements (#13408)

mirror of https://github.com/likelovewant/ollama-for-amd.git synced 2025-12-21 14:26:30 +00:00

* feat: Bump llama.cpp to the latest master (17f7f4b)

This brings in significant improvements to prefill performance for all
models using the SSM_CONV and SSM_SCAN ops (granite4, jamba, falcon-h,
nemotron-h, Qwen3 Next) on Apple Metal.

See https://github.com/ggml-org/llama.cpp/pull/17876

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* feat: Update patches 1-4

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* fix: Update patches 5-12

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* feat: Update patches 13-18

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* feat: Update patch 20

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* feat: Update patches 21-31

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

* feat: Sync vendored code

The two files I'm not sure about here are the swap from gemma3-iswa.cpp to
gemma3.cpp (I chose to include this because I think it's required), and the
inclusion of `ggml-zendnn.h` which I chose to omit.

Branch: LlamaCPPMetalSSMImprovements

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

---------

Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

This commit is contained in:

Gabe Goodhart

2025-12-10 13:59:27 -07:00

committed by

GitHub

parent c34fc64688

commit b95693056c

115 changed files with 5176 additions and 2585 deletions

									
										2

llama/build-info.cpp
									
										generated
									
										vendored
									
												View File
												
				@@ -1,4 +1,4 @@

				int LLAMA_BUILD_NUMBER = 0;

				char const *LLAMA_COMMIT = "7f8ef50cce40e3e7e4526a3696cb45658190e69a";

				char const *LLAMA_COMMIT = "17f7f4baad8b3a716ee139da7bb56ae984e8c0fa";

				char const *LLAMA_COMPILER = "";

				char const *LLAMA_BUILD_TARGET = "";

feat: llama.cpp bump (17f7f4) for SSM performance improvements (#13408)

2 llama/build-info.cpp generated vendored Unescape Escape View File

2

llama/build-info.cpp generated vendored

View File