Stability AI 正式发布了 Stable Diffusion 3,这款开源图像生成模型在多个维度实现了重大突破,再次证明了开源社区在 AI 领域的强大实力。
SD3 的核心升级
Stable Diffusion 3 在图像质量上取得显著进步:更真实的光影效果,更精细的细节表现,更准确的文字渲染,更好的人体结构。SD3 终于解决了 AI 绘图中的文字难题:准确生成指定文字,正确的拼写和排版,多种字体风格支持。
技术架构
SD3 采用多模态扩散 Transformer (MMDiT) 架构,不同于之前的 U-Net,具有更好的扩展性,更强的上下文理解,更高效的训练,支持更高分辨率。
模型规格
| 版本 | 参数量 | 显存 |
|---|---|---|
| SD3 Small | 2B | 8GB |
| SD3 Medium | 8B | 16GB |
| SD3 Large | 16B | 24GB |
性能对比
| 模型 | 美学评分 | 文字准确率 |
|---|---|---|
| SD3 Large | 9.2 | 89% |
| SDXL | 8.5 | 42% |
| DALL-E 3 | 9.0 | 85% |
开源许可
SD3 采用 Stability AI 社区许可:个人和商业用途免费(年收入小于100万美元),模型权重完全开源可下载。
结语
Stable Diffusion 3 的发布再次证明开源社区的力量。对于创作者和开发者来说,这是一个功能强大且自由开放的图像生成工具。
发表回复