添加qwopus 3.5 27B启动指令
This commit is contained in:
@@ -1,3 +1,5 @@
|
|||||||
|
## Qwen3.5 35B A3B
|
||||||
|
|
||||||
./llama-server --model /home/jimmy/NVME/model/Qwen3.5-35B-A3B-UD-IQ4_XS.gguf --alias "Qwen3.5-35B-A3B" --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 --host 0.0.0.0 --port 11434 --kv-unified --cache-type-k q8_0 --cache-type-v q8_0 --flash-attn on --fit on --ctx-size 262144 --jinja --no-mmap -t 24 -np 4 -ngl 999
|
./llama-server --model /home/jimmy/NVME/model/Qwen3.5-35B-A3B-UD-IQ4_XS.gguf --alias "Qwen3.5-35B-A3B" --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 --host 0.0.0.0 --port 11434 --kv-unified --cache-type-k q8_0 --cache-type-v q8_0 --flash-attn on --fit on --ctx-size 262144 --jinja --no-mmap -t 24 -np 4 -ngl 999
|
||||||
|
|
||||||
context_size 128K = 131072
|
context_size 128K = 131072
|
||||||
@@ -5,6 +7,9 @@ context_size 128K = 131072
|
|||||||
No thinking: --chat-template-kwargs "{\"enable_thinking\": false}"
|
No thinking: --chat-template-kwargs "{\"enable_thinking\": false}"
|
||||||
|
|
||||||
|
|
||||||
|
## Qwen3.5 27B
|
||||||
|
|
||||||
|
./llama-server --model /home/jimmy/NVME/model/Qwopus3.5-27B-v3-Q4_K_S.gguf --alias "Qwen3.5-35B-A3B" --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 --host 0.0.0.0 --port 11434 --kv-unified --cache-type-k q8_0 --cache-type-v q8_0 --flash-attn on --fit on --ctx-size 262144 --jinja --no-mmap -t 24 -np 4 -ngl 999
|
||||||
|
|
||||||
|
|
||||||
## gemma 4
|
## gemma 4
|
||||||
|
|||||||
Reference in New Issue
Block a user