HiDream-I1是HiDream.ai团队推出的开源图像生成基础模型,拥有17亿参数,采用MIT许可证。该模型在多项基准测试中(DPG-Bench/GenEval/HPSv2.1)超越SDXL、DALL-E 3等主流模型,支持秒级高质量图像生成。提供完整版、蒸馏版和极速版三种变体,适用于不同场景需求。技术层面融合扩散模型与混合专家架构(MoE),集成多模态文本编码器,在语义理解、细节渲染和风格多样性方面表现突出。
通义万象是阿里云推出的一款AI绘画大模型,支持文本生成图片、相似图片生成、图片风格迁移和视频生成。该项目旨在通过生成式AI技术支持多模态内容创作,特别适合企业用户在中国市场进行创意表达。目前处于beta测试阶段,完全免费,每天提供50点灵感值,每次生成成功扣除1点灵感值,每天零点重置。
Pikaso 是由 Freepik 开发的一款 AI 驱动的在线绘图工具,旨在通过简单草图和文字提示快速生成艺术效果。它适合所有年龄和技能水平的用户,提供实时生成、元素库和自定义设置等功能,让艺术创作变得轻松有趣。
Sketch-a-Sketch是一个专为小白用户设计的简笔画生成图片的模型。与ControlNet相比,它的独特之处在于会先自动补充简笔画的细节,然后再生成图片,从而使生成的图片细节更加丰富。
Fast Neural Style是由Facebook AI Research(FAIR)开发的一款图像风格转换模型,能够将任意图像转化为指定艺术风格的图像。通过深度卷积神经网络(CNN)和风格迁移技术,Fast Neural Style能够将普通图像快速转换成类似梵高、毕加索等大师的画作风格。该模型优化了风格转换的速度和质量,适用于艺术创作、社交平台内容生成、图像编辑等领域。
Flux Image Generator是一款基于AI的Chrome扩展工具,能够将文本描述转化为精美的图像。用户可以在浏览器中轻松创建、编辑和增强视觉效果,适用于多种场景,如艺术创作、营销设计、故事场景可视化以及项目演示等。
Cogview3 是一种通过中继扩散技术实现更精细、更快速的文本生成图像的项目。它利用先进的中继扩散技术,能够在短时间内生成高质量的图像,满足从艺术创作到实际应用的多方面需求。
Drag Your GAN是一个基于生成对抗网络的交互式图像操控工具,允许用户在生成图像流形上通过点的方式进行直观操作。
Kolors是一个由潜在扩散技术驱动的前沿文本到图像模型,经过数十亿对数据的训练,具备卓越的视觉质量、复杂语义和文本渲染能力,超越了众多开源和闭源模型。
OrigamiSimulator是一个基于WebGL的实时折纸模拟器,允许用户创建、调整和展示各种折纸模型,旨在为教育和艺术创作提供支持。
Undress AI v2 是一款基于人工智能的应用,用户只需上传一张照片,即可自动处理结果,展示未穿衣物的效果。该项目结合了先进的计算机视觉技术,旨在为用户提供隐私保护的同时,探索图像处理的可能性。
Beeyond AI是一款强大的多功能工具,专为满足各种需求而设计。它通过AI驱动的解决方案提升工作效率,涵盖内容创作、艺术、营销、教育、健身、音乐等多个领域,能够轻松简化复杂任务。
Stable Fast 3D是Stability AI的革命性模型,可以通过单张图像在仅仅0.5秒内创建高质量的3D资产。
Clipdrop是一个由人工智能驱动的应用、插件和资源的生态系统,允许创作者在几秒钟内轻松创建惊艳的视觉效果。它利用AI算法完成背景去除、图片修复、图像放大、稳定扩散等任务。
ZMO.AI是一个强大的AI驱动内容创作平台,提供图像生成、艺术创作、对象移除和图像编辑等多种功能,旨在提升用户的创作效率和图像质量。
RDA AI是一个互动式的每日AI艺术通讯,展示采用先进技术创作的尖端艺术作品,提供用户与最新艺术动态的连接。
PIA 是一个可以将写实照片快速转换为3D动漫效果的工具,支持人物照片,并且生成速度快,效果尚可,适合艺术创作和数字内容生成。
BlinkShot是一个实时AI图像生成器,能够快速生成高质量的图像,支持自定义分辨率和生成步骤,适合艺术创作和设计领域。
Stable Diffusion Conceptualizer集合了众多非常好用的SD Text Inversion插件,这些插件可用于SD生成不同风格的图片。它提供用户友好的界面,支持多种风格的图像生成,并且能够输出高质量的图像,非常适合艺术创作和设计项目使用。
LongPrompt-LLamaGen是一个提升版的LLamaGen模型,融合了长文本提示和最前沿的AI技术,旨在为创意人士和开发者提供前所未有的图像生成能力。该模型不仅支持长文本提示,还通过增强的生成效果和多样性,满足用户对创意和质量的双重需求。
DiffMorpher是首个利用扩散模型进行图像变形的方法。其关键思路是通过对两个图像拟合两个LoRA(局部反向自动编码器)来捕捉它们的语义,并在LoRA参数和潜在噪声之间进行插值,以确保平滑的语义过渡。
FlowDCN是一个探索类似DCN架构的项目,旨在快速生成任意分辨率的图像。该项目利用先进的深度学习技术,提供高效的图像生成解决方案,适用于各种应用场景,包括艺术创作、游戏设计等。
基于Node.js、Vue3、uniapp的AIGC平台,集成ChatGPT、Midjourney绘画、Suno音乐、视频服务等,支持私有化部署,适用于个人、团队和企业。该平台为用户提供了一站式的AI解决方案,能够满足不同用户的需求,包括创意写作、艺术创作和内容生成等。
该项目能够根据上传的音乐文件生成对应的视觉图像,适用于视频制作和艺术创作,能够将音乐与视觉艺术结合,为创意项目提供灵感。
AttnGAN是微软开发的一种人工智能图像生成器,能够根据用户提供的文本描述生成对应的高质量图片。它通过训练模型使其理解文本与图像之间的关联,从而在生成图像时能够关注到文本描述的不同部分,确保生成的图像与描述内容高度一致,具有较强的实用性和灵活性。
HunyuanDiT是腾讯混元发布的文生图大模型,首个中文原生的DiT架构文生图开源模型。它支持中英文双语输入及理解,提供LoRA小规模数据集训练方案与可控制插件ControlNet。该模型通过专属加速库显著缩短生图时间,支持微调和个性化模型创建,并基于ComfyUI的图形化界面或Hugging Face Diffusers通用模型库调用。
EditGAN 是一个基于生成对抗网络的高精度语义图像编辑工具,旨在为用户提供强大而灵活的图像生成和编辑能力。
Oceans of AI是一款安卓应用,提供超过2500种免费的和收费的AI工具,用户可以根据需求轻松探索、收藏和使用这些工具。
这是一套包含600多个ChatGPT提示的项目,旨在激发创意和想象力。无论你是作家、艺术家,还是只是想要寻找新点子的普通人,这些提示涵盖了广泛的话题和场景,助你突破思维的局限。
Idyllic是一个创新的平台,利用AI的力量生成、编辑和融合图像,提供无缝且互动的设计体验,旨在赋能普通设计师。用户只需描述自己的愿景,平台便能在数秒内生成令人惊叹的艺术作品。