DeepFloyd IF 是一个模块化的项目,由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示,模型便会根据输入生成高分辨率图像。
diffusers-webui是一个基于Gradio构建的Web用户界面,旨在与Stable Diffusion的Diffusers格式协同工作,提供简单易用的图像生成体验。用户可以通过图形界面轻松上传模型、调整参数,并实时预览生成的图像。
Diffusers是HuggingFace官方推出的生成模型工具包,集成了Stable Diffusion 3、DALL-E 3等前沿模型,支持文生图、图生图、视频生成等全流程。该库支持多种新功能和pipeline,包括UniDiffuser、DiffEdit、IF DreamBooth和A1111 LoRA等,适用于数字内容创作、工业设计原型生成和教育可视化内容制作等领域。
OpenAI旗下DALL·E 2模型
杜克大学的开源项目PULSE,可以让很模糊的人变清晰的脸(当然非真实还原),基于深度学习技术,支持多种输入格式,社区积极贡献。
Stable Diffusion 3.5是一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成变得更加便捷。
Diffusion AI 是一款基于人工智能的Windows软件,通过简单的文本输入将创意转化为惊艳的视觉图像,帮助用户释放创造力,生成高质量的视觉效果。
ClarityWrite是一个集成AI技术的内容创作平台,专为市场营销人员、企业家和创作者设计。它能够生成高质量的书面、视觉和代码内容,配备了内置模板、AI机器人和图像生成工具,帮助用户消除写作障碍,提供无限的内容创作可能性。
Ask Vandelay 是一个先进的 AI 建筑图像生成器,能够将简单的文字提示转化为惊艳的高质量建筑图像。它为建筑师、房地产开发商和设计师节省时间,提升创意。
Fine-tune Phi-2是一个用于对Phi-2模型进行微调的项目,包含使用QLoRA技术进行微调、创建合成对话数据集以及支持多个GPU并行训练的功能。该项目提供了详细的示例代码和文档,允许用户灵活配置训练参数,以便优化模型的表现。
JoyTag是一个开源图像标注模型,专注于积极性和包容性,使用Danbooru标注方案,适用于从手绘到摄影等各种类型的图像。该模型基于ViT-B/16架构,经过660M个样本的训练,支持5000多个标签,能够对输入图像输出对5000多个不同标签的预测结果。
Stable Video Diffusion 是一个可以本地部署的视频生成模型,旨在通过先进的生成技术创建高质量视频内容。该项目基于生成对抗网络(GAN)技术,支持多种输入格式,能够生成多样化的视频内容,并集成了多种预训练模型,便于用户快速上手。
AItoZee是一个全方位的AI内容创作平台,提供多种工具,帮助用户轻松生成高质量的AI驱动内容。
Alby.email是一个基于AI的工具,通过电子邮件提供快速准确的响应,支持多种功能,如写邮件、生成广告文案、创建图像、翻译语言、创意生成等。
imageflow 是一个用于 Web 服务器的高性能图像处理工具,支持多种图像处理功能,能够高效地处理图像请求。
Chandler是一个经济实惠的个人AI助手,旨在回答您的任何问题,具备图像生成和数据分析功能。
DreamSampler结合了扩散采样和评分蒸馏技术,旨在实现图像处理中的图像生成与操控。该项目可以通过生成模型实现图像生成,并运用基于评分的技术对现有图像进行操控,提供了强大的图像编辑和生成能力。
Fast Image Retrieval (FIRe) 是一个开源项目,旨在促进图像检索研究,提供高效的图像搜索和特征提取功能。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型