Stability AI 正式发布了 Stable Diffusion 3,这款开源图像生成模型在多个维度实现了重大突破,再次证明了开源社区在 AI 领域的强大实力。

SD3 的核心升级

Stable Diffusion 3 在图像质量上取得显著进步:更真实的光影效果,更精细的细节表现,更准确的文字渲染,更好的人体结构。SD3 终于解决了 AI 绘图中的文字难题:准确生成指定文字,正确的拼写和排版,多种字体风格支持。

技术架构

SD3 采用多模态扩散 Transformer (MMDiT) 架构,不同于之前的 U-Net,具有更好的扩展性,更强的上下文理解,更高效的训练,支持更高分辨率。

模型规格

版本参数量显存
SD3 Small2B8GB
SD3 Medium8B16GB
SD3 Large16B24GB

性能对比

模型美学评分文字准确率
SD3 Large9.289%
SDXL8.542%
DALL-E 39.085%

开源许可

SD3 采用 Stability AI 社区许可:个人和商业用途免费(年收入小于100万美元),模型权重完全开源可下载。

结语

Stable Diffusion 3 的发布再次证明开源社区的力量。对于创作者和开发者来说,这是一个功能强大且自由开放的图像生成工具。