# ========== LLM 配置(用于古诗词分析) ========== llm: base_url: "https://api.siliconflow.cn/v1" # 兼容 OpenAI API 的端点地址 api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo" # API 密钥,也可通过环境变量 LLM_API_KEY 设置 model: "deepseek-ai/DeepSeek-V3.2" # 部署的模型名称 temperature: 0.9 max_tokens: 8192 # ========== 图片生成配置 ========== image: # --- 加载模式(三选一,优先级: openvino > comfyui > model_id) --- # 模式一(OpenVINO):填写 openvino.model_path,使用 OpenVINO IR 模型推理 # 模式二(ComfyUI): 填写 comfyui 的三个 safetensors 路径 # 模式三(HuggingFace):填写 model_id model_id: "Tongyi-MAI/Z-Image-Turbo" # HuggingFace 模型 ID 或本地 HF 格式目录 # --- OpenVINO 推理模式 --- # 需要先通过 optimum-cli 导出模型: # optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov openvino: model_path: "D:\\models\\ov" # OpenVINO IR 模型目录路径(填写则启用 OpenVINO 模式) device: "GPU" # OpenVINO 设备: GPU | CPU # --- ComfyUI 拆分文件模式(三个路径都填则启用) --- comfyui: text_encoder: "" # safetensors 格式 text encoder 路径 transformer: "" # safetensors 格式 transformer 路径 vae: "" # safetensors 格式 VAE 路径 torch_dtype: "float16" # auto | bfloat16 | float16 | float32 # auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32 device: "auto" # auto | cuda | xpu | mps | cpu # auto: 自动检测可用设备(cuda > xpu > mps > cpu) size_preset: "phone" # 尺寸预设(优先于 height/width),可选值: # square — 1024×1024 正方形(默认) # phone — 576×1024 手机壁纸 9:16 # phone_hd — 768×1344 手机壁纸 9:16 高清 # desktop — 1024×576 电脑壁纸 16:9 # desktop_hd — 1344×768 电脑壁纸 16:9 高清 # ultrawide — 1536×640 带鱼屏壁纸 21:9 # custom — 使用下方 height/width 自定义尺寸 height: 1024 # 仅 size_preset: custom 时生效 width: 1024 # 仅 size_preset: custom 时生效 num_inference_steps: 9 # Z-Image-Turbo 推荐 9(实际 8 步 DiT) guidance_scale: 0.0 # Turbo 模型应设为 0(不支持 negative prompt) seed: -1 # -1 表示随机种子 images_per_prompt: 2 # 每个 prompt 生成几张图(不同种子),1-10 enable_cpu_offload: "model" # false: 全部常驻显卡(需≈24GB+) # model: 组件级卸载(峰值≈4-6GB) # sequential: 逐层卸载(最省显存但较慢) # true: 等同于 model # OpenVINO 模式下此选项无效 attention_backend: "sdpa" # sdpa | flash | flash_3(XPU 仅支持 sdpa) prompt_language: "zh" # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言 # zh: 使用中文 prompt(Qwen3 中文编码器原生支持) # en: 使用英文 prompt style_variants: 2 # 每分镜实际出图的画风数:1 仅首套,2 两套均生成(LLM 仍输出两套文案) style_preference: "" # 风格期望(可选,留空则由 LLM 根据诗意自动选择) # 可选值示例:水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩 # 文人画 / 泼墨大写意 / 浅绛山水 # 具有电影光影质感的新国风写实 # ========== LoRA 配置(可选) ========== # 加载 LoRA 可显著提升特定画风质量,如水墨风 # 推荐:zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink lora: enabled: false path: "" # LoRA 文件路径(.safetensors) weight: 0.8 # LoRA 权重(推荐 0.6-1.2) trigger_words: "" # 触发词,会自动追加到 prompt 开头 # ========== 输出配置 ========== output: dir: "./output" # 图片输出目录 filename_prefix: "poem" # 文件名前缀 save_prompts: true # 是否保存 prompt 到 txt 文件