ComfyUI 本地文生图模型对比指南

主流开源模型的区别、特点与选择建议，帮你选出最适合的模型。

模型速览

特性	SDXL	SDXL Turbo	SD3.5 Medium	Flux.1 Schnell
文件大小	6.9GB	6.9GB	~7GB	~12GB
生图速度（M4）	1-2 分钟	3-10 秒	1-2 分钟	1-2 分钟
图像质量	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
支持中文提示词	❌	❌	✅	❌
最佳分辨率	1024×1024	512×512	1024×1024	1024×1024
推荐步数	20-30	4-8	20-30	4-8
开发者	Stability AI	Stability AI	Stability AI	Black Forest Labs

各模型介绍

SDXL — 最主流的开源模型

文件： sd_xl_base_1.0.safetensors（6.9GB）

目前最广泛使用的文生图模型，社区生态最丰富（LoRA、ControlNet 全支持）。

优点：

质量高，细节丰富，1024×1024 最佳分辨率
社区资源最多，教程和插件最全

缺点：

生图慢，M4 上一张图 1-2 分钟
不支持中文提示词
需要较高显卡内存

适合场景： 公众号封面、海报等需要精细质量的图片。

参数推荐： steps 20-30，cfg 7

SDXL Turbo — 极速出图

文件： sd_xl_turbo_1.0.safetensors（6.9GB）

SDXL 的加速版本，用对抗蒸馏技术将生图速度提升 10 倍以上。

优点：

极快：3-10 秒出一张图
跟 SDXL 共享大部分生态（LoRA、ControlNet 兼容）

缺点：

细节不如 SDXL，放大看边缘偏模糊
最佳分辨率 512×512
不支持中文提示词

适合场景： 抖音视频配图（手机上看不出区别）、快速试稿、批量生成。

参数推荐： steps 4-8，cfg 2-4

SD3.5 Medium — 中文友好

文件： sd3.5_medium.safetensors（~7GB）

Stability AI 第三代模型，原生支持中文提示词。

优点：

支持中文提示词，直接输入中文即可
质量跟 SDXL 相当
对文字和手部细节有改善

缺点：

社区生态不如 SDXL 丰富（LoRA 少）
速度跟 SDXL 一样慢

适合场景： 不想写英文 prompt、需要生成中文文字的场景。

参数推荐： steps 20-30，cfg 7

Flux.1 Schnell — 质量王者

文件： flux1-schnell.safetensors（~12GB）

Black Forest Labs（前 Stability AI 核心团队）出品，目前质量最高的开源模型。

优点：

质量最高，细节、光影、构图都优于 SDXL
对复杂 prompt 的理解更强

缺点：

体积大：12GB，硬盘和内存占用都高
M4 加载慢
不支持中文提示词

适合场景： 需要最高质量输出的场景。

参数推荐： steps 4-8，cfg 3.5

如何选择

场景	推荐模型
抖音配图（批量）	SDXL Turbo
公众号封面	SDXL
写中文 prompt	SD3.5 Medium
最高质量输出	Flux.1 Schnell

ComfyUI 切换模型

在 加载 Checkpoint 节点的下拉菜单中直接选择即可：

sd_xl_base_1.0.safetensors     ← SDXL
sd_xl_turbo_1.0.safetensors     ← Turbo（快）
sd3.5_medium.safetensors        ← SD3.5（中文）
flux1-schnell.safetensors        ← Flux（高质量）

切换后按对应的 steps 和 cfg 参数，其他节点不用改。