所有AI工具AI图像工具

Stable Diffusion 3.5官网 – 开源文本生成图像模型

Stable Diffusion 3.5 是由 Stability AI 发布的开源文本生成图像模型系列,包括多个变体如 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Medium。这些模型基于多模态扩散...

标签:

AI交流(进群备注:Stable Diffusion 3.5)

Stable Diffusion 3.5 是由 Stability AI 发布的开源文本生成图像模型系列,包括多个变体如 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Medium。这些模型基于多模态扩散变换器(MMDiT)架构,旨在生成高质量图像,特别适用于文本提示生成图像的任务。项目强调其高度可定制性,适合在消费级硬件上运行,且在 Stability AI 社区许可下免费使用。该许可允许非商业用途免费,以及商业用途年收入低于 100 万美元的组织或个人免费使用,高于此需联系企业许可。用户对生成图像拥有所有权,无需担心许可限制。

Stable Diffusion 3.5的特点:

  • 1. 多个模型变体:Stable Diffusion 3.5 Large(81 亿参数)、Stable Diffusion 3.5 Medium(25 亿参数)
  • 2. 分辨率能力:Large 支持 1 兆像素,Medium 支持 0.25–2 兆像素
  • 3. 硬件需求:Medium 需要 9.9 GB VRAM(不包括文本编码器)以达到最佳性能
  • 4. 图像质量优越,提示遵循性强
  • 5. 支持细调、LoRA 等高度可定制
  • 6. 在消费级硬件上高效运行
  • 7. 输出多样,支持不同风格如 3D、摄影、绘画等

Stable Diffusion 3.5的功能:

  • 1. 从 Hugging Face 下载模型权重
  • 2. 从 GitHub 获取推理代码,支持自托管
  • 3. 通过 Amazon SageMaker JumpStart 访问部分模型
  • 4. 用于媒体、娱乐和零售内容创作
  • 5. 适合中小型项目的定制化应用

相关导航

暂无评论

暂无评论...