ZImageTurbo/config.yaml

# ========== LLM 配置（用于古诗词分析） ==========
llm:
  base_url: "https://api.siliconflow.cn/v1"    # 兼容 OpenAI API 的端点地址
  api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo"              # API 密钥，也可通过环境变量 LLM_API_KEY 设置
  model: "deepseek-ai/DeepSeek-V3.2"                           # 部署的模型名称
  temperature: 0.9
  max_tokens: 8192

# ========== 图片生成配置 ==========
image:
  # --- 加载模式（三选一，优先级: openvino > comfyui > model_id） ---
  # 模式一（OpenVINO）：填写 openvino.model_path，使用 OpenVINO IR 模型推理
  # 模式二（ComfyUI）：  填写 comfyui 的三个 safetensors 路径
  # 模式三（HuggingFace）：填写 model_id
  model_id: "Tongyi-MAI/Z-Image-Turbo"     # HuggingFace 模型 ID 或本地 HF 格式目录

  # --- OpenVINO 推理模式 ---
  # 需要先通过 optimum-cli 导出模型：
  #   optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov
  openvino:
    model_path: "D:\\models\\ov"                          # OpenVINO IR 模型目录路径（填写则启用 OpenVINO 模式）
    device: "GPU"                           # OpenVINO 设备: GPU | CPU

  # --- ComfyUI 拆分文件模式（三个路径都填则启用） ---
  comfyui:
    text_encoder: ""                        # safetensors 格式 text encoder 路径
    transformer: ""                         # safetensors 格式 transformer 路径
    vae: ""                                 # safetensors 格式 VAE 路径
  torch_dtype: "float16"                       # auto | bfloat16 | float16 | float32
                                            #   auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32
  device: "auto"                            # auto | cuda | xpu | mps | cpu
                                            #   auto: 自动检测可用设备（cuda > xpu > mps > cpu）
  size_preset: "phone"                     # 尺寸预设（优先于 height/width），可选值：
                                            #   square       — 1024×1024  正方形（默认）
                                            #   phone        — 576×1024   手机壁纸 9:16
                                            #   phone_hd     — 768×1344   手机壁纸 9:16 高清
                                            #   desktop      — 1024×576   电脑壁纸 16:9
                                            #   desktop_hd   — 1344×768   电脑壁纸 16:9 高清
                                            #   ultrawide    — 1536×640   带鱼屏壁纸 21:9
                                            #   custom       — 使用下方 height/width 自定义尺寸
  height: 1024                              # 仅 size_preset: custom 时生效
  width: 1024                               # 仅 size_preset: custom 时生效
  num_inference_steps: 9                    # Z-Image-Turbo 推荐 9（实际 8 步 DiT）
  guidance_scale: 0.0                       # Turbo 模型应设为 0（不支持 negative prompt）
  seed: -1                                  # -1 表示随机种子
  images_per_prompt: 2                      # 每个 prompt 生成几张图（不同种子），1-10
  enable_cpu_offload: "model"               # false: 全部常驻显卡（需≈24GB+）
                                            # model: 组件级卸载（峰值≈4-6GB）
                                            # sequential: 逐层卸载（最省显存但较慢）
                                            # true: 等同于 model
                                            # OpenVINO 模式下此选项无效
  attention_backend: "sdpa"                 # sdpa | flash | flash_3（XPU 仅支持 sdpa）
  prompt_language: "zh"                     # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言
                                            #   zh: 使用中文 prompt（Qwen3 中文编码器原生支持）
                                            #   en: 使用英文 prompt
  style_variants: 2                         # 每分镜实际出图的画风数：1 仅首套，2 两套均生成（LLM 仍输出两套文案）
  style_preference: ""                      # 风格期望（可选，留空则由 LLM 根据诗意自动选择）
                                            #   可选值示例：水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩
                                            #             文人画 / 泼墨大写意 / 浅绛山水
                                            #             具有电影光影质感的新国风写实

# ========== LoRA 配置（可选） ==========
# 加载 LoRA 可显著提升特定画风质量，如水墨风
# 推荐：zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink
lora:
  enabled: false
  path: ""                                  # LoRA 文件路径（.safetensors）
  weight: 0.8                               # LoRA 权重（推荐 0.6-1.2）
  trigger_words: ""                         # 触发词，会自动追加到 prompt 开头

# ========== 输出配置 ==========
output:
  dir: "./output"                           # 图片输出目录
  filename_prefix: "poem"                   # 文件名前缀
  save_prompts: true                        # 是否保存 prompt 到 txt 文件