Stable Diffusion 3.5官网 – 开源文本生成图像模型

Stable Diffusion 3.5 是由 Stability AI 发布的开源文本生成图像模型系列，包括多个变体如 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Medium。这些模型基于多模态扩散变换器（MMDiT）架构，旨在生成高质量图像，特别适用于文本提示生成图像的任务。项目强调其高度可定制性，适合在消费级硬件上运行，且在 Stability AI 社区许可下免费使用。该许可允许非商业用途免费，以及商业用途年收入低于 100 万美元的组织或个人免费使用，高于此需联系企业许可。用户对生成图像拥有所有权，无需担心许可限制。

Stable Diffusion 3.5的特点:

1. 多个模型变体：Stable Diffusion 3.5 Large（81 亿参数）、Stable Diffusion 3.5 Medium（25 亿参数）
2. 分辨率能力：Large 支持 1 兆像素，Medium 支持 0.25–2 兆像素
3. 硬件需求：Medium 需要 9.9 GB VRAM（不包括文本编码器）以达到最佳性能
4. 图像质量优越，提示遵循性强
5. 支持细调、LoRA 等高度可定制
6. 在消费级硬件上高效运行
7. 输出多样，支持不同风格如 3D、摄影、绘画等

Stable Diffusion 3.5的功能:

1. 从 Hugging Face 下载模型权重
2. 从 GitHub 获取推理代码，支持自托管
3. 通过 Amazon SageMaker JumpStart 访问部分模型
4. 用于媒体、娱乐和零售内容创作
5. 适合中小型项目的定制化应用

相关导航

ACE++开源项目 – 一键生成角色一致图像

阿里开源的图像生成与编辑框架，利用扩散模型和上下文感知内容填充技术，通过文本指令实现对图像的智能化创建与修改。集成改进的长上下文条件单元(LCU)，可同时处理图像生成、对象替换、背景修改等多种任务，支持单图像输入即可完成零训练的角色一致化生成。

WorldxAi官网 – 为每个领域寻找完美的AI工具

WorldxAi是一个AI工具目录，旨在帮助用户找到适合各个领域的工具，同时提供付费AI工具的替代方案。该平台涵盖多个类别，如视频创作、博客写作、配音、图像生成等。

arthemy官网 – 为您的项目创造惊艳图像

arthemy是一个强大的图像生成工具，旨在帮助用户为商业或个人项目创建出色的图像。它支持通过迭代树演变图像，允许用户保存和存储项目、提示和设置，并能够从内容、形状或深度开始创作图像。

HappyDiffusion – Stable Diffusion Online-访问Stable Diffusion的最快方式

HappyDiffusion是访问Stable Diffusion Automatic1111 WebUI的最快、最简单的方法，适用于移动设备和PC。该平台提供100%的隐私保护，极快的图像生成速度，超过50种图像模型，并支持无限加载自定义图像模型。

docker-diffusers-api开源项目 – 用Docker提供Diffusers的API

docker-diffusers-api是一个使用Docker运行并提供REST API接口的项目，旨在简化Diffusers和Stable Diffusion模型的使用。该项目支持多种模型和管道，用户可以方便地在容器中部署和调用图像生成服务。

scrip.ai官网 – 文本生成图像和内容的在线服务

scrip.ai 是一个在线服务，能够根据文本生成图像、撰写文章和生成YouTube视频描述。该平台提供免费和付费计划，用户可以通过其网站轻松访问。

360 智脑官网 – 多模态生成AI大模型

360 智脑是由奇虎 360 公司独立开发的 AI 大模型，拥有数百亿参数规模和多模态生成能力。它支持文本生成、图像生成、文本到视频转换等功能，涵盖生成创作、多轮对话、逻辑推理等十大核心能力，旨在为用户提供强大的 AI 辅助工具。其训练基于 3.4 万亿 token 的语料库，支持多达 360K 的上下文长度，适用于复杂的 AI 交互场景。

Anything To Image开源项目 – 从任意内容生成图像的工具

利用ImageBind和Stable Diffusion相结合，从任意内容生成图像的工具。该工具无需进行训练，通过统一潜空间和Stable Diffusion技术实现图像生成，支持多种输入方式，能够生成高质量的视觉内容。

diffusion-rs开源项目 – 极速推理工具

扩散模型的极速推理工具，能快速处理复杂的图像生成任务，提升模型运行效率

Salvador – DALL•E 3 UI-连接用户与DALL•E 3的直观界面

Salvador是一个设计直观的用户界面，旨在缩短用户与OpenAI强大的DALL•E 3模型之间的距离。它作为一个无缝的中介，允许用户使用他们的API密钥轻松地与DALL•E 3进行交互，无需复杂的编码或技术专长。Salvador简化了DALL•E 3的图像生成过程，用户只需输入OpenAI API密钥和提示，即可轻松生成图像，确保无论是经验丰富的开发者还是创意爱好者都能无障碍地利用DALL•E 3的强大功能。

万兴爱画官网 – AI驱动的艺术创作平台

万兴爱画（Wondershare AIGC Art Creative Inspiration Platform）是一个基于AI技术的艺术创作平台，支持用户通过输入文本或上传图像生成艺术作品。平台提供多种风格选择，适合创意艺术生成，旨在帮助用户轻松创作出精美的数字艺术作品。无论是初学者还是专业设计师，都可以通过该平台实现艺术创作的灵感与表达。

EasyDiffusion Online官网 – 免费AI图像生成工具

EasyDiffusion Online是一个免费的图像生成工具，利用AI模型将用户的词语和短语迅速转化为令人惊叹的艺术作品。用户只需输入文本，便可使用Stable Diffusion的先进技术生成美丽的图像。

Wan2.1官网 – AI视频生成平台

Wan2.1 是由阿里巴巴开发的开放式视频生成模型，平台 wan.video 提供文本到视频和图像到视频功能。用户可通过输入文字或上传图片生成5秒动态视频，并支持提示词优化、灵感模式和音频生成等功能。平台设有积分系统，用户可以通过每日签到、点赞和发布作品赚取积分，每次生成视频消耗10积分。Wan2.1 在多个基准测试中表现优异，支持多种分辨率和任务，适合内容创作者和技术爱好者使用。

EPAGESTORE.AI官网 – AI驱动的内容创作平台

EPAGESTORE.AI 是一个基于人工智能的平台，提供多种工具用于内容创作、图像生成和代码生成，功能强大且完全免费。用户可以输入创意，让我们的AI完成工作，并进行优化和定制。

Qwen-Agent开源项目 – 基于Qwen的智能代理框架

Qwen-Agent是阿里开源的一个基于Qwen2.0的智能代理框架，具备指令遵循、工具使用、任务规划和记忆能力，可用于构建各种能执行复杂任务的AI代理。开发者可基于此框架开发Agent应用，充分利用Qwen模型的强大功能，如处理长文档、支持多种工具使用、实现复杂任务规划等。项目还提供了浏览器助手、代码解释器、自定义助手等示例应用，帮助开发者快速上手和部署复杂的AI代理应用。

暂无评论

暂无评论...