Real-ESRGAN是一个开源的AI项目,其主要功能是实用的图像/视频修复算法。
这是一个完整的管道,用于在消费硬件上使用LoRA和RLHF微调Alpaca LLM。基于Alpaca架构实现人类反馈的强化学习(RLHF),基本上是ChatGPT的一个变体,但使用的是Alpaca。
一个基于Stable Diffusion的图像生成Web界面,用户可以通过简单的界面生成高质量的图像。
这是国内第一个真正的开源、可下载、可运行的 LLaMA2 模型,提供中文版 Llama2模型及中英文 SFT 数据集,兼容适配所有针对原版 llama-2-chat 模型的优化。
Felvin是一个无代码的AI市场,允许用户快速创建、定制和货币化高质量的AI应用,无需编程知识。用户可以简单地将应用创意变为现实。
Leiapix AI是一个免费的图像生成工具,将2D图像转化为3D光场图像和动画。用户只需上传所选的2D图像,先进的算法会将其转化为令人惊叹的3D光场创作。处理完成后,用户可以在LeiaPix社区或社交网络上探索和分享他们的创作。
本课程讲述量化基础知识,旨在帮助开发人员压缩模型以便在消费者硬件上运行。
这个开源项目基于Stable Diffusion进行优化,是一个AI绘画模型。它可以输入中英文文本,并生成多种现代艺术风格的高质量图像。
DreamPreweddingAI结合人工智能的力量,帮助用户轻松创建美丽的婚前照片,无需旅行、服装或摄影师的开销,捕捉独特的爱情故事。
该项目提供了一个完整的管道,用于在消费级硬件上微调ChatGLM LLM,结合了LoRA(低秩适应)和RLHF(基于人类反馈的强化学习)技术,旨在提升ChatGLM的能力,使其类似于ChatGPT。
这是一个AI图像处理工具,可以进行图像增强和去马赛克处理。它使用人工智能技术自动识别马赛克并通过算法去除,提高图像清晰度和质量。同时支持增加亮度、对比度和饱和度等增强处理,可用于图像处理、视觉效果和图像分析等领域。
ChatRWKV 是一个类似于 ChatGPT 的开源工具,使用了基于 100% RNN 的 RWKV 语言模型。该语言模型是作者对 RNN 进行魔改之后得到的,在性能上已经接近了 transformer,且梯度可以无限走且可以并行化,同时具有 RNN 和 transformer 的所有优点。这个开源项目可以在每个人的电脑和手机上直接运行,可以用于聊天等场景。
这是一个基于PyTorch的库,旨在加速在分布外(OOD)检测方面的研究,支持多种检测方法,并提供易用的API设计。该项目结合深度学习模型进行OOD任务,提供数据集和基准测试,且可与PyTorch深度学习框架无缝集成。
DLTA-AI是一个标注工具,整合了先进的计算机视觉模型,旨在使图像数据集的标注更加容易。它提供了无缝的体验和直观的工作流程,能够进行数据标注、追踪和注释,并且利用了人工智能技术。该项目由Usama Ahmed在GitHub上进行维护。
GFPGAN是腾讯开源的AI模型,旨在恢复老照片。用户可以通过上传老照片到测试地址,并使用GFPGAN进行图像修复和恢复。
本文介绍了一个名为DDSP-SVC 3.0的开源项目,它是一个可以替代低配SO-VITS-SVC的工具。使用该工具,可以用更低的显存和更短的时间训练出模型,生成AI音乐。尽管生成的音乐质量相对较低,但可以用于快速生成音乐。
XTTS是一个强大的声音克隆项目,用户只需提供几秒钟的音频样本,即可创造出高质量的AI语音克隆。该项目具备出色的零样本克隆能力,并且支持多种语言,能够生成更加自然的语调和表达力。
融合图像聊天、分割和生成/编辑的AI应用概念验证项目,基于LLaVA、SEEM和GLIGEN三个相关开源项目实现。
Background Remover是一个开源的命令行工具,利用AI技术,可以快速移除图像和视频中的背景。它使用了u2net这个开源的目标检测算法作为底层技术。