76 lines
5.3 KiB
YAML
76 lines
5.3 KiB
YAML
# ========== LLM 配置(用于古诗词分析) ==========
|
||
llm:
|
||
base_url: "https://api.siliconflow.cn/v1" # 兼容 OpenAI API 的端点地址
|
||
api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo" # API 密钥,也可通过环境变量 LLM_API_KEY 设置
|
||
model: "deepseek-ai/DeepSeek-V3.2" # 部署的模型名称
|
||
temperature: 0.9
|
||
max_tokens: 8192
|
||
|
||
# ========== 图片生成配置 ==========
|
||
image:
|
||
# --- 加载模式(三选一,优先级: openvino > comfyui > model_id) ---
|
||
# 模式一(OpenVINO):填写 openvino.model_path,使用 OpenVINO IR 模型推理
|
||
# 模式二(ComfyUI): 填写 comfyui 的三个 safetensors 路径
|
||
# 模式三(HuggingFace):填写 model_id
|
||
model_id: "Tongyi-MAI/Z-Image-Turbo" # HuggingFace 模型 ID 或本地 HF 格式目录
|
||
|
||
# --- OpenVINO 推理模式 ---
|
||
# 需要先通过 optimum-cli 导出模型:
|
||
# optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov
|
||
openvino:
|
||
model_path: "D:\\models\\ov" # OpenVINO IR 模型目录路径(填写则启用 OpenVINO 模式)
|
||
device: "GPU" # OpenVINO 设备: GPU | CPU
|
||
|
||
# --- ComfyUI 拆分文件模式(三个路径都填则启用) ---
|
||
comfyui:
|
||
text_encoder: "" # safetensors 格式 text encoder 路径
|
||
transformer: "" # safetensors 格式 transformer 路径
|
||
vae: "" # safetensors 格式 VAE 路径
|
||
torch_dtype: "float16" # auto | bfloat16 | float16 | float32
|
||
# auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32
|
||
device: "auto" # auto | cuda | xpu | mps | cpu
|
||
# auto: 自动检测可用设备(cuda > xpu > mps > cpu)
|
||
size_preset: "phone" # 尺寸预设(优先于 height/width),可选值:
|
||
# square — 1024×1024 正方形(默认)
|
||
# phone — 576×1024 手机壁纸 9:16
|
||
# phone_hd — 768×1344 手机壁纸 9:16 高清
|
||
# desktop — 1024×576 电脑壁纸 16:9
|
||
# desktop_hd — 1344×768 电脑壁纸 16:9 高清
|
||
# ultrawide — 1536×640 带鱼屏壁纸 21:9
|
||
# custom — 使用下方 height/width 自定义尺寸
|
||
height: 1024 # 仅 size_preset: custom 时生效
|
||
width: 1024 # 仅 size_preset: custom 时生效
|
||
num_inference_steps: 9 # Z-Image-Turbo 推荐 9(实际 8 步 DiT)
|
||
guidance_scale: 0.0 # Turbo 模型应设为 0(不支持 negative prompt)
|
||
seed: -1 # -1 表示随机种子
|
||
images_per_prompt: 2 # 每个 prompt 生成几张图(不同种子),1-10
|
||
enable_cpu_offload: "model" # false: 全部常驻显卡(需≈24GB+)
|
||
# model: 组件级卸载(峰值≈4-6GB)
|
||
# sequential: 逐层卸载(最省显存但较慢)
|
||
# true: 等同于 model
|
||
# OpenVINO 模式下此选项无效
|
||
attention_backend: "sdpa" # sdpa | flash | flash_3(XPU 仅支持 sdpa)
|
||
prompt_language: "zh" # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言
|
||
# zh: 使用中文 prompt(Qwen3 中文编码器原生支持)
|
||
# en: 使用英文 prompt
|
||
style_variants: 2 # 每分镜实际出图的画风数:1 仅首套,2 两套均生成(LLM 仍输出两套文案)
|
||
style_preference: "" # 风格期望(可选,留空则由 LLM 根据诗意自动选择)
|
||
# 可选值示例:水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩
|
||
# 文人画 / 泼墨大写意 / 浅绛山水
|
||
# 具有电影光影质感的新国风写实
|
||
|
||
# ========== LoRA 配置(可选) ==========
|
||
# 加载 LoRA 可显著提升特定画风质量,如水墨风
|
||
# 推荐:zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink
|
||
lora:
|
||
enabled: false
|
||
path: "" # LoRA 文件路径(.safetensors)
|
||
weight: 0.8 # LoRA 权重(推荐 0.6-1.2)
|
||
trigger_words: "" # 触发词,会自动追加到 prompt 开头
|
||
|
||
# ========== 输出配置 ==========
|
||
output:
|
||
dir: "./output" # 图片输出目录
|
||
filename_prefix: "poem" # 文件名前缀
|
||
save_prompts: true # 是否保存 prompt 到 txt 文件
|