本地部署全功能版stable diffusion,支持多种配置和功能,适用于深度学习图像生成任务。该项目允许用户在本地环境中生成高质量的图像,支持多种输入方式和参数设置,能够满足不同的生成需求。
Stable Diffusion长文本加权嵌入工具,突破77个token限制,为Stable Diffusion生成长文本加权提示嵌入,支持与Huggingface Diffusers兼容,适用于Stable Diffusion 1.5、SDXL和3版本,支持无限长度提示和权重调整
DragGAN是一个开源图像编辑工具,允许用户通过拖动交互点来修改图像,现已支持本地部署和Web演示体验。此外,DragGAN还有一个非官方实现,效果尚可。
Majesta AI 是一个经过良好训练的生成式 AI 图像生成工具,能够将您的想法转化为照片、图像或设计。无论是艺术创作、产品设计还是个人项目,Majesta AI 都能帮助用户实现他们的创意,提供独特且高质量的视觉作品。
Diffusion AI 是一款基于人工智能的Windows软件,通过简单的文本输入将创意转化为惊艳的视觉图像,帮助用户释放创造力,生成高质量的视觉效果。
Chinese LLaVA是一个支持中英文双语的开源多模态模型,能够进行视觉与文本的结合对话,具备高效的理解能力和灵活的应用场景,适合商用开发。
SegViT是一个基于纯视觉变换器的语义分割项目,旨在提高图像分割任务的效率和性能。它能够处理多种图像分割任务,适应不同的应用场景,为研究人员和开发者提供了强大的工具。
这是一个Stable Diffusion web UI的插件,旨在简化用户在生成图像时的prompt添加和编辑过程,增强用户体验并与Stable Diffusion无缝集成。
OctiAI是一个专门为ChatGPT、Mid Journey及其他内容创作AI模型设计的提示生成器。它的主要目标是通过使用图像和文本提示来增强创造力和改善结果。
Visual Electric是首个为创意专业人士设计的图像生成器,提供无限画布和直观界面,简化了AI驱动视觉创作的过程。
CheXagent是一个基于视觉和语言的基础模型,专注于胸部X光片的解读,旨在解决医学图像领域中大规模视觉-语言数据集的有限性等挑战。该模型利用大规模的指令微调数据集CheXinstruct,设计了一个临床大型语言模型(LLM)和一个用于表示X射线图像的视觉编码器,同时连接视觉和语言模态的网络,提供了新的评估基准CheXbench用于系统评估。
Stable-Diffusion-NCNN是一个基于C++版ncnn实现的图像生成项目,采用简化的Stable Diffusion算法,特别适合低配置设备,并且仅使用CPU进行计算,能够在内存为8G的环境下运行。
SurgicalSAM是一个高效的手术工具分割项目,支持类提示,旨在提升手术视频分析和医疗图像处理的效率。