ollama-for-amd/llama/patches at 8fafc8af77105030ce485c96c355dafce316ec24 - ollama-for-amd - Git.NotJustAnna.net

mirrors/ollama-for-amd

mirror of https://github.com/likelovewant/ollama-for-amd.git synced 2025-12-21 22:33:56 +00:00

Files

History

Santosh Bhavani 8fafc8af77 ml/backend/ggml: NVML fallback for unified memory GPUs (#12619 )

* Simplify NVML fallback for unified memory GPUs

Remove device-specific checks and environment variable dependency for
NVML_ERROR_NOT_SUPPORTED fallback. When NVML doesn't support memory
queries, unconditionally use /proc/meminfo instead of checking device
names or OLLAMA_UNIFIED_MEMORY environment variable.

This provides better memory reporting by using MemAvailable which
accounts for reclaimable memory, avoiding the underreporting issue
described in NVIDIA support article a_id/5728.

Tested on NVIDIA GB10 unified memory iGPU with consistent and accurate
memory reporting across multiple model load/unload cycles.

* Add NVML fallback patch for unified memory GPUs

2025-10-15 11:40:06 -07:00

..

.gitignore

update vendored llama.cpp and ggml (#11823 )

2025-08-14 14:42:58 -07:00

0001-ggml-backend-malloc-and-free-using-the-same-compiler.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0002-pretokenizer.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0003-clip-unicode.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0004-solar-pro.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0005-fix-deepseek-deseret-regex.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0006-maintain-ordering-for-rules-for-grammar.patch

Update GGML to b6646 (#12245 )

2025-10-02 14:47:10 -07:00

0007-sort-devices-by-score.patch

Update GGML to b6646 (#12245 )

2025-10-02 14:47:10 -07:00

0008-add-phony-target-ggml-cpu-for-all-cpu-variants.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0009-remove-amx.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0010-fix-string-arr-kv-loading.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0011-ollama-debug-tensor.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0012-add-ollama-vocab-for-grammar-support.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0013-add-argsort-and-cuda-copy-for-i32.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0014-graph-memory-reporting-on-failure.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0015-ggml-Export-GPU-UUIDs.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0016-add-C-API-for-mtmd_input_text.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0017-no-power-throttling-win32-with-gnuc.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0018-BF16-macos-version-guard.patch

Update GGML to b6646 (#12245 )

2025-10-02 14:47:10 -07:00

0019-Enable-CUDA-Graphs-for-gemma3n.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0020-Disable-ggml-blas-on-macos-v13-and-older.patch

Update GGML to b6646 (#12245 )

2025-10-02 14:47:10 -07:00

0021-fix-mtmd-audio.cpp-build-on-windows.patch

llm: New memory management

2025-08-14 15:24:01 -07:00

0022-ggml-No-alloc-mode.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0023-decode-disable-output_all.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0024-ggml-Enable-resetting-backend-devices.patch

logs: fix bogus "0 MiB free" log line (#12590 )

2025-10-14 11:26:28 -07:00

0025-harden-uncaught-exception-registration.patch

harden uncaught exception registration (#12120 )

2025-09-02 09:43:55 -07:00

0026-GPU-discovery-enhancements.patch

Llama cpp bump (df1b612): granite docling / mamba2 optimizations / multimodal encoding fixes (#12552 )

2025-10-13 15:26:18 -07:00

0027-vulkan-get-GPU-ID-ollama-v0.11.5.patch

Vulkan based on #9650 (#11835 )

2025-10-14 10:59:58 -07:00

0028-vulkan-pci-and-memory.patch

Vulkan based on #9650 (#11835 )

2025-10-14 10:59:58 -07:00

0029-NVML-fallback-for-unified-memory-GPUs.patch

ml/backend/ggml: NVML fallback for unified memory GPUs (#12619 )

2025-10-15 11:40:06 -07:00