From b2e3a1436e2727b0204423b93df05ca00aa727a4 Mon Sep 17 00:00:00 2001
From: jimmychen <jimmychen23333@gmail.com>
Date: Sun, 19 Apr 2026 03:22:06 -0400
Subject: [PATCH] =?UTF-8?q?=E6=B7=BB=E5=8A=A0Qwen3-Coder-Next=E5=90=AF?=
 =?UTF-8?q?=E5=8A=A8=E6=8C=87=E4=BB=A4?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 llama-cpp.md | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/llama-cpp.md b/llama-cpp.md
index 118a932..0343b3f 100644
--- a/llama-cpp.md
+++ b/llama-cpp.md
@@ -11,6 +11,10 @@ No thinking: --chat-template-kwargs "{\"enable_thinking\": false}"
 
 ./llama-server --model /home/jimmy/NVME/model/Qwen3.6-35B-A3B-UD-IQ4_NL.gguf --alias "Qwen3.6-35B-A3B" --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 --host 0.0.0.0 --port 11434 --kv-unified --cache-type-k q8_0 --cache-type-v q8_0 --flash-attn on --fit on --ctx-size 262144 --jinja --no-mmap -t 24 -np 4 -ngl 999
 
+## Qwen3-Coder-Next
+
+./llama-server --model /home/jimmy/NVME/model/Qwen3-Coder-Next-UD-IQ4_XS.gguf --alias "Qwen3-Coder-Next" --seed 3407 --temp 1.0 --top-p 0.95 --min-p 0.01 --top-k 40 --host 0.0.0.0 --port 11434 --kv-unified --cache-type-k q8_0 --cache-type-v q8_0 --flash-attn on --fit on --ctx-size 262144 --jinja -t 24 -np 4 -ngl 999 --n-cpu-moe 24
+
 
 ## Qwen3.5 27B