AI交流(进群备注:Stable Diffusion 3.5)

Stable Diffusion 3.5 是由 Stability AI 发布的开源文本生成图像模型系列,包括多个变体如 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Medium。这些模型基于多模态扩散变换器(MMDiT)架构,旨在生成高质量图像,特别适用于文本提示生成图像的任务。项目强调其高度可定制性,适合在消费级硬件上运行,且在 Stability AI 社区许可下免费使用。该许可允许非商业用途免费,以及商业用途年收入低于 100 万美元的组织或个人免费使用,高于此需联系企业许可。用户对生成图像拥有所有权,无需担心许可限制。
Stable Diffusion 3.5的特点:
- 1. 多个模型变体:Stable Diffusion 3.5 Large(81 亿参数)、Stable Diffusion 3.5 Medium(25 亿参数)
- 2. 分辨率能力:Large 支持 1 兆像素,Medium 支持 0.25–2 兆像素
- 3. 硬件需求:Medium 需要 9.9 GB VRAM(不包括文本编码器)以达到最佳性能
- 4. 图像质量优越,提示遵循性强
- 5. 支持细调、LoRA 等高度可定制
- 6. 在消费级硬件上高效运行
- 7. 输出多样,支持不同风格如 3D、摄影、绘画等
Stable Diffusion 3.5的功能:
- 1. 从 Hugging Face 下载模型权重
- 2. 从 GitHub 获取推理代码,支持自托管
- 3. 通过 Amazon SageMaker JumpStart 访问部分模型
- 4. 用于媒体、娱乐和零售内容创作
- 5. 适合中小型项目的定制化应用
相关导航
暂无评论...