add zimage local and qwen silliconflow

2026-03-26 22:07:32 +08:00
commit 14cad19e58
7 changed files with 1676 additions and 0 deletions
--- a/config.yaml
+++ b/config.yaml
@@ -0,0 +1,74 @@
+# ========== LLM 配置（用于古诗词分析） ==========
+llm:
+  base_url: "https://api.siliconflow.cn/v1"    # 兼容 OpenAI API 的端点地址
+  api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo"              # API 密钥，也可通过环境变量 LLM_API_KEY 设置
+  model: "Qwen/Qwen3.5-397B-A17B"                           # 部署的模型名称
+  temperature: 0.9
+  max_tokens: 8192
+
+# ========== 图片生成配置 ==========
+image:
+  # --- 加载模式（三选一，优先级: openvino > comfyui > model_id） ---
+  # 模式一（OpenVINO）：填写 openvino.model_path，使用 OpenVINO IR 模型推理
+  # 模式二（ComfyUI）：  填写 comfyui 的三个 safetensors 路径
+  # 模式三（HuggingFace）：填写 model_id
+  model_id: "Tongyi-MAI/Z-Image-Turbo"     # HuggingFace 模型 ID 或本地 HF 格式目录
+
+  # --- OpenVINO 推理模式 ---
+  # 需要先通过 optimum-cli 导出模型：
+  #   optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov
+  openvino:
+    model_path: "D:\\models\\ov"                          # OpenVINO IR 模型目录路径（填写则启用 OpenVINO 模式）
+    device: "GPU"                           # OpenVINO 设备: GPU | CPU
+
+  # --- ComfyUI 拆分文件模式（三个路径都填则启用） ---
+  comfyui:
+    text_encoder: ""                        # safetensors 格式 text encoder 路径
+    transformer: ""                         # safetensors 格式 transformer 路径
+    vae: ""                                 # safetensors 格式 VAE 路径
+  torch_dtype: "float16"                       # auto | bfloat16 | float16 | float32
+                                            #   auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32
+  device: "auto"                            # auto | cuda | xpu | mps | cpu
+                                            #   auto: 自动检测可用设备（cuda > xpu > mps > cpu）
+  size_preset: "phone_hd"                     # 尺寸预设（优先于 height/width），可选值：
+                                            #   square       — 1024×1024  正方形（默认）
+                                            #   phone        — 576×1024   手机壁纸 9:16
+                                            #   phone_hd     — 768×1344   手机壁纸 9:16 高清
+                                            #   desktop      — 1024×576   电脑壁纸 16:9
+                                            #   desktop_hd   — 1344×768   电脑壁纸 16:9 高清
+                                            #   ultrawide    — 1536×640   带鱼屏壁纸 21:9
+                                            #   custom       — 使用下方 height/width 自定义尺寸
+  height: 1024                              # 仅 size_preset: custom 时生效
+  width: 1024                               # 仅 size_preset: custom 时生效
+  num_inference_steps: 9                    # Z-Image-Turbo 推荐 9（实际 8 步 DiT）
+  guidance_scale: 0.0                       # Turbo 模型应设为 0（不支持 negative prompt）
+  seed: -1                                  # -1 表示随机种子
+  images_per_prompt: 2                      # 每个 prompt 生成几张图（不同种子），1-10
+  enable_cpu_offload: "model"               # false: 全部常驻显卡（需≈24GB+）
+                                            # model: 组件级卸载（峰值≈4-6GB）
+                                            # sequential: 逐层卸载（最省显存但较慢）
+                                            # true: 等同于 model
+                                            # OpenVINO 模式下此选项无效
+  attention_backend: "sdpa"                 # sdpa | flash | flash_3（XPU 仅支持 sdpa）
+  prompt_language: "zh"                     # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言
+                                            #   zh: 使用中文 prompt（Qwen3 中文编码器原生支持）
+                                            #   en: 使用英文 prompt
+  style_preference: ""                      # 风格期望（可选，留空则由 LLM 根据诗意自动选择）
+                                            #   可选值示例：水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩
+                                            #             文人画 / 泼墨大写意 / 浅绛山水
+                                            #             具有电影光影质感的新国风写实
+
+# ========== LoRA 配置（可选） ==========
+# 加载 LoRA 可显著提升特定画风质量，如水墨风
+# 推荐：zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink
+lora:
+  enabled: false
+  path: ""                                  # LoRA 文件路径（.safetensors）
+  weight: 0.8                               # LoRA 权重（推荐 0.6-1.2）
+  trigger_words: ""                         # 触发词，会自动追加到 prompt 开头
+
+# ========== 输出配置 ==========
+output:
+  dir: "./output"                           # 图片输出目录
+  filename_prefix: "poem"                   # 文件名前缀
+  save_prompts: true                        # 是否保存 prompt 到 txt 文件