add zimage local and qwen silliconflow

This commit is contained in:
JimmysAIPG
2026-03-26 22:07:32 +08:00
commit 14cad19e58
7 changed files with 1676 additions and 0 deletions

74
config.yaml Normal file
View File

@@ -0,0 +1,74 @@
# ========== LLM 配置(用于古诗词分析) ==========
llm:
base_url: "https://api.siliconflow.cn/v1" # 兼容 OpenAI API 的端点地址
api_key: "sk-rooopitditvwbgdjxnkywgvdhsepfucbxcwoagickbnrxqyo" # API 密钥,也可通过环境变量 LLM_API_KEY 设置
model: "Qwen/Qwen3.5-397B-A17B" # 部署的模型名称
temperature: 0.9
max_tokens: 8192
# ========== 图片生成配置 ==========
image:
# --- 加载模式(三选一,优先级: openvino > comfyui > model_id ---
# 模式一OpenVINO填写 openvino.model_path使用 OpenVINO IR 模型推理
# 模式二ComfyUI 填写 comfyui 的三个 safetensors 路径
# 模式三HuggingFace填写 model_id
model_id: "Tongyi-MAI/Z-Image-Turbo" # HuggingFace 模型 ID 或本地 HF 格式目录
# --- OpenVINO 推理模式 ---
# 需要先通过 optimum-cli 导出模型:
# optimum-cli export openvino --model Tongyi-MAI/Z-Image-Turbo --weight-format int8 z-image-turbo-ov
openvino:
model_path: "D:\\models\\ov" # OpenVINO IR 模型目录路径(填写则启用 OpenVINO 模式)
device: "GPU" # OpenVINO 设备: GPU | CPU
# --- ComfyUI 拆分文件模式(三个路径都填则启用) ---
comfyui:
text_encoder: "" # safetensors 格式 text encoder 路径
transformer: "" # safetensors 格式 transformer 路径
vae: "" # safetensors 格式 VAE 路径
torch_dtype: "float16" # auto | bfloat16 | float16 | float32
# auto: CUDA/MPS→bfloat16, XPU→float16, CPU→float32
device: "auto" # auto | cuda | xpu | mps | cpu
# auto: 自动检测可用设备cuda > xpu > mps > cpu
size_preset: "phone_hd" # 尺寸预设(优先于 height/width可选值
# square — 1024×1024 正方形(默认)
# phone — 576×1024 手机壁纸 9:16
# phone_hd — 768×1344 手机壁纸 9:16 高清
# desktop — 1024×576 电脑壁纸 16:9
# desktop_hd — 1344×768 电脑壁纸 16:9 高清
# ultrawide — 1536×640 带鱼屏壁纸 21:9
# custom — 使用下方 height/width 自定义尺寸
height: 1024 # 仅 size_preset: custom 时生效
width: 1024 # 仅 size_preset: custom 时生效
num_inference_steps: 9 # Z-Image-Turbo 推荐 9实际 8 步 DiT
guidance_scale: 0.0 # Turbo 模型应设为 0不支持 negative prompt
seed: -1 # -1 表示随机种子
images_per_prompt: 2 # 每个 prompt 生成几张图不同种子1-10
enable_cpu_offload: "model" # false: 全部常驻显卡需≈24GB+
# model: 组件级卸载峰值≈4-6GB
# sequential: 逐层卸载(最省显存但较慢)
# true: 等同于 model
# OpenVINO 模式下此选项无效
attention_backend: "sdpa" # sdpa | flash | flash_3XPU 仅支持 sdpa
prompt_language: "zh" # zh | en — 发送给 Z-Image-Turbo 的 prompt 语言
# zh: 使用中文 promptQwen3 中文编码器原生支持)
# en: 使用英文 prompt
style_preference: "" # 风格期望(可选,留空则由 LLM 根据诗意自动选择)
# 可选值示例:水墨写意 / 青绿山水 / 工笔花鸟 / 工笔重彩
# 文人画 / 泼墨大写意 / 浅绛山水
# 具有电影光影质感的新国风写实
# ========== LoRA 配置(可选) ==========
# 加载 LoRA 可显著提升特定画风质量,如水墨风
# 推荐zyd232's Ink Style (Civitai) — 触发词: 水墨风 / ink style / zydink
lora:
enabled: false
path: "" # LoRA 文件路径(.safetensors
weight: 0.8 # LoRA 权重(推荐 0.6-1.2
trigger_words: "" # 触发词,会自动追加到 prompt 开头
# ========== 输出配置 ==========
output:
dir: "./output" # 图片输出目录
filename_prefix: "poem" # 文件名前缀
save_prompts: true # 是否保存 prompt 到 txt 文件