主流开源模型的区别、特点与选择建议,帮你选出最适合的模型。
模型速览
| 特性 | SDXL | SDXL Turbo | SD3.5 Medium | Flux.1 Schnell |
|---|---|---|---|---|
| 文件大小 | 6.9GB | 6.9GB | ~7GB | ~12GB |
| 生图速度(M4) | 1-2 分钟 | 3-10 秒 | 1-2 分钟 | 1-2 分钟 |
| 图像质量 | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 支持中文提示词 | ❌ | ❌ | ✅ | ❌ |
| 最佳分辨率 | 1024×1024 | 512×512 | 1024×1024 | 1024×1024 |
| 推荐步数 | 20-30 | 4-8 | 20-30 | 4-8 |
| 开发者 | Stability AI | Stability AI | Stability AI | Black Forest Labs |
各模型介绍
SDXL — 最主流的开源模型
文件: sd_xl_base_1.0.safetensors(6.9GB)
目前最广泛使用的文生图模型,社区生态最丰富(LoRA、ControlNet 全支持)。
优点:
- 质量高,细节丰富,1024×1024 最佳分辨率
- 社区资源最多,教程和插件最全
缺点:
- 生图慢,M4 上一张图 1-2 分钟
- 不支持中文提示词
- 需要较高显卡内存
适合场景: 公众号封面、海报等需要精细质量的图片。
参数推荐: steps 20-30,cfg 7
SDXL Turbo — 极速出图
文件: sd_xl_turbo_1.0.safetensors(6.9GB)
SDXL 的加速版本,用对抗蒸馏技术将生图速度提升 10 倍以上。
优点:
- 极快:3-10 秒出一张图
- 跟 SDXL 共享大部分生态(LoRA、ControlNet 兼容)
缺点:
- 细节不如 SDXL,放大看边缘偏模糊
- 最佳分辨率 512×512
- 不支持中文提示词
适合场景: 抖音视频配图(手机上看不出区别)、快速试稿、批量生成。
参数推荐: steps 4-8,cfg 2-4
SD3.5 Medium — 中文友好
文件: sd3.5_medium.safetensors(~7GB)
Stability AI 第三代模型,原生支持中文提示词。
优点:
- 支持中文提示词,直接输入中文即可
- 质量跟 SDXL 相当
- 对文字和手部细节有改善
缺点:
- 社区生态不如 SDXL 丰富(LoRA 少)
- 速度跟 SDXL 一样慢
适合场景: 不想写英文 prompt、需要生成中文文字的场景。
参数推荐: steps 20-30,cfg 7
Flux.1 Schnell — 质量王者
文件: flux1-schnell.safetensors(~12GB)
Black Forest Labs(前 Stability AI 核心团队)出品,目前质量最高的开源模型。
优点:
- 质量最高,细节、光影、构图都优于 SDXL
- 对复杂 prompt 的理解更强
缺点:
- 体积大:12GB,硬盘和内存占用都高
- M4 加载慢
- 不支持中文提示词
适合场景: 需要最高质量输出的场景。
参数推荐: steps 4-8,cfg 3.5
如何选择
| 场景 | 推荐模型 |
|---|---|
| 抖音配图(批量) | SDXL Turbo |
| 公众号封面 | SDXL |
| 写中文 prompt | SD3.5 Medium |
| 最高质量输出 | Flux.1 Schnell |
ComfyUI 切换模型
在 加载 Checkpoint 节点的下拉菜单中直接选择即可:
1 | sd_xl_base_1.0.safetensors ← SDXL |
切换后按对应的 steps 和 cfg 参数,其他节点不用改。