基于之前meta发布的Segment Anything的图像处理工具。借助该应用可以实现在图片中Remove Anything、Fill Anything、Replace Anything,极大地方便了用户对图像的自由编辑和创作。
一个基于Stable Diffusion的图像生成Web界面,用户可以通过简单的界面生成高质量的图像。
由S-Lab、南洋理工大学和上海人工智能实验室联合发布的文本驱动的人物视频生成技术,能够根据用户输入的文本描述生成高质量的人物视频,支持多种风格和场景,提供用户友好的操作界面。
Chart-GPT 是一款智能工具,能够根据用户输入的文本描述自动生成各种美观的图表,支持多种图表类型,并提供实时预览。其用户友好的界面和快速生成的特性,旨在帮助用户节省时间,提高工作效率。
这个项目能分析图像中对象之间的关系,是一个将Meta的Segment-Anything模型与ECCV'22论文相结合的演示:Panoptic Scene Graph Generation。
Track Anything 是一个高效的目标跟踪项目,旨在实现视频中物体的准确跟踪与抠图,具有出色的实时性能和用户友好的界面。
一个使用人工智能技术让绘画作品动起来的工具,用户可以在线编辑绘画作品中的人物动作,生成动图。该项目能够识别简笔画中的骨骼结构,将静态图像转换为动态动画,非常适合儿童绘画作品的动画化,旨在促进儿童的创新和创造力。
DeepFloyd IF 是一个模块化的项目,由一个冻结的文本编码器和三个级联的像素扩散模块组成。用户只需输入文本提示,模型便会根据输入生成高分辨率图像。
这是一个包含所有人工智能生成图片工具的合集开源项目,还包括了多种后期处理工具。
Real-ESRGAN是一个开源的AI项目,其主要功能是实用的图像/视频修复算法。
Background Remover是一个开源的命令行工具,利用AI技术,可以快速移除图像和视频中的背景。它使用了u2net这个开源的目标检测算法作为底层技术。
这个开源项目的主要功能是代理MidJourney的Discord频道,并且通过API调用AI绘图的功能。
shap-e是OpenAI开发的一个开源AI 3D算法,能够根据单张图像生成多个3D模型。它可以在高性能显卡上高效运行,生成的模型支持导出为mesh格式,便于在Blender等软件中进行再编辑,适用于各种形状和物体的建模需求。
DragGAN是一个开源图像编辑工具,允许用户通过拖动交互点来修改图像,现已支持本地部署和Web演示体验。此外,DragGAN还有一个非官方实现,效果尚可。
一个由SOTA AI模型驱动的免费开源图像清理工具,帮助你擦除图片中你不想要的内容,移除背景、面部修复等工作。
MiniGPT-4是一款结合视觉与语言的大模型,能够基于图片内容生成描述、回答问题,甚至进行推理分析。它在视觉理解和自然语言处理方面表现出色,可识别图像细节、物体关系,并结合上下文提供智能解读。MiniGPT-4是GPT-4的开源版本,提供强大的自然语言处理能力,适用于多种AI应用场景,包括图像描述生成、文本与图像的问答、图像内容分析以及多模态信息检索。
Panel OpenAI是一个综合应用,结合了ChatGPT的自然语言处理能力和DALL·E 2的图像生成技术,旨在提供用户友好的界面和多样的交互模式,支持实时反馈与响应,方便用户在一个平台上进行丰富的创作和交流。
这个开源项目的功能是支持中文版的 Visual Chatgpt,使用了机器学习的技术。
ChatGLM-6B是清华大学开发的一个开源双语对话语言模型,基于General Language Model (GLM)架构,具有62亿参数。它支持中英双语对话,并具备图像理解的多模态功能。模型经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,旨在提供高质量的对话生成和自然语言处理能力。结合模型量化技术,可在消费级显卡上本地部署(INT4量化级别下最低只需6GB显存),并针对中文问答和对话进行了优化。
Xpression Camera是一款获奖的虚拟摄像头应用,用户只需一张照片即可瞬间变身为任何有面孔的角色,无需处理时间。它使用户能够在视频聊天、直播或在Zoom、Twitch和YouTube等平台上创建内容时实时重新定义自己的荧幕形象。
Xno.ai是一个平台,提供19种顶尖的文本转图像AI,支持39个GPU的高效运算,旨在帮助用户生成高质量的图像。
Wombo是一个在线平台,利用人工智能的力量快速将用户的创意转化为美丽的艺术作品。用户只需输入一个提示并选择艺术风格,Wombo Dream即可在几秒钟内生成AI艺术作品。
WatermarkRemover.io 是一款在线工具,利用AI技术去除图像中的水印。它拥有强大的算法,能够准确检测和去除半透明水印,使图像无水印。
Vizcom是一个平台,用户可以在几秒钟内将草图转化为精美的概念图。它具备原生AI工具和内置的绘图功能,帮助设计团队和创意专业人士可视化他们的想法并实现创意。用户可以导入现有图纸或直接在应用内绘制,使用熟悉的绘图工具和图层进行创作。一旦草图完成,Vizcom的AI工具能迅速将其渲染为高质量概念图。平台还支持导入3D文件和使用简单的文本描述可视化3D模型,同时提供协作功能,让用户能够创建工作区与他人无缝合作。
Upscale.media是一个基于AI的图像放大器,可以在不失去纹理或细节的情况下放大和增强照片。它使用先进的AI技术,将图像放大到原始尺寸的2倍或4倍,同时保持卓越的图像质量。
Topaz Video AI是由Topaz Labs开发的一款先进的人工智能工具,旨在彻底改变专业人士提升和放大视频的方式。该软件利用AI的力量执行多种任务,显著提高视频画质,对于摄影师、电影制作人、内容创作者和后期制作专业人士来说是不可或缺的工具。
Texture Lab 是一个开创性的工具,旨在简化从文本描述生成无缝高质量纹理的过程,专为游戏开发者、平面设计师和数字艺术家设计。无论是创造神话生物的龙鳞,还是设计古埃及的瓷砖,Texture Lab 都提供了一个用户友好的平台,提升了纹理创作的创造力和效率。
Textomap 2.0 是一款创新工具,可从任何包含位置信息的文本源生成地图。用户可以通过与ChatGPT互动,将任何主题或信息可视化为地图,并且能够在同一浏览器标签页中创建和查看地图。它旨在简化内容创作和信息展示的过程。
"Swell AI"是一个由AI驱动的工具,旨在简化和增强内容创作,特别是对播客制作人、代理机构和网络来说。该工具专注于自动化播客和视频相关内容的写作过程。主要特点和好处包括:
StoryWizard是一个由AI驱动的工具,可以快速高效地创作精彩的儿童故事。它利用最新的生成AI技术,生成独特而引人入胜的故事,配以生动的图像和迷人的情节,旨在为儿童提供安全、愉快的阅读体验。