Files
ZImageTurbo/config.yaml
2026-03-31 08:21:17 +08:00

76 lines
5.3 KiB
YAML
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# ========== LLM 配置(用于古诗词分析) ==========
llm:
base_url: "https://api.siliconflow.cn/v1" # 兼容 OpenAI API 的端点地址
api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo" # API 密钥,也可通过环境变量 LLM_API_KEY 设置
model: "deepseek-ai/DeepSeek-V3.2" # 部署的模型名称
temperature: 0.9
max_tokens: 8192
# ========== 图片生成配置 ==========
image:
# --- 加载模式(三选一,优先级: openvino > comfyui > model_id ---
# 模式一OpenVINO填写 openvino.model_path使用 OpenVINO IR 模型推理
# 模式二ComfyUI 填写 comfyui 的三个 safetensors 路径
# 模式三HuggingFace填写 model_id
model_id: "Tongyi-MAI/Z-Image-Turbo" # HuggingFace 模型 ID 或本地 HF 格式目录
# --- OpenVINO 推理模式 ---
# 需要先通过 optimum-cli 导出模型:
# optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov
openvino:
model_path: "D:\\models\\ov" # OpenVINO IR 模型目录路径(填写则启用 OpenVINO 模式)
device: "GPU" # OpenVINO 设备: GPU | CPU
# --- ComfyUI 拆分文件模式(三个路径都填则启用) ---
comfyui:
text_encoder: "" # safetensors 格式 text encoder 路径
transformer: "" # safetensors 格式 transformer 路径
vae: "" # safetensors 格式 VAE 路径
torch_dtype: "float16" # auto | bfloat16 | float16 | float32
# auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32
device: "auto" # auto | cuda | xpu | mps | cpu
# auto: 自动检测可用设备cuda > xpu > mps > cpu
size_preset: "phone" # 尺寸预设(优先于 height/width可选值
# square — 1024×1024 正方形(默认)
# phone — 576×1024 手机壁纸 9:16
# phone_hd — 768×1344 手机壁纸 9:16 高清
# desktop — 1024×576 电脑壁纸 16:9
# desktop_hd — 1344×768 电脑壁纸 16:9 高清
# ultrawide — 1536×640 带鱼屏壁纸 21:9
# custom — 使用下方 height/width 自定义尺寸
height: 1024 # 仅 size_preset: custom 时生效
width: 1024 # 仅 size_preset: custom 时生效
num_inference_steps: 9 # Z-Image-Turbo 推荐 9实际 8 步 DiT
guidance_scale: 0.0 # Turbo 模型应设为 0不支持 negative prompt
seed: -1 # -1 表示随机种子
images_per_prompt: 2 # 每个 prompt 生成几张图不同种子1-10
enable_cpu_offload: "model" # false: 全部常驻显卡需≈24GB+
# model: 组件级卸载峰值≈4-6GB
# sequential: 逐层卸载(最省显存但较慢)
# true: 等同于 model
# OpenVINO 模式下此选项无效
attention_backend: "sdpa" # sdpa | flash | flash_3XPU 仅支持 sdpa
prompt_language: "zh" # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言
# zh: 使用中文 promptQwen3 中文编码器原生支持)
# en: 使用英文 prompt
style_variants: 2 # 每分镜实际出图的画风数1 仅首套2 两套均生成LLM 仍输出两套文案)
style_preference: "" # 风格期望(可选,留空则由 LLM 根据诗意自动选择)
# 可选值示例:水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩
# 文人画 / 泼墨大写意 / 浅绛山水
# 具有电影光影质感的新国风写实
# ========== LoRA 配置(可选) ==========
# 加载 LoRA 可显著提升特定画风质量,如水墨风
# 推荐zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink
lora:
enabled: false
path: "" # LoRA 文件路径(.safetensors
weight: 0.8 # LoRA 权重(推荐 0.6-1.2
trigger_words: "" # 触发词,会自动追加到 prompt 开头
# ========== 输出配置 ==========
output:
dir: "./output" # 图片输出目录
filename_prefix: "poem" # 文件名前缀
save_prompts: true # 是否保存 prompt 到 txt 文件