MASt3R 是一个专注于在三维空间中实现精确图像匹配的创新项目。它通过结合深度学习技术和三维几何约束,显著提高了图像匹配的准确性和鲁棒性。项目提供了预训练模型和详细的训练流程,支持视觉定位、场景重建等任务。MASt3R 的核心在于其独特的架构设计,能够有效提取图像特征并在三维空间中建立对应关系。
在音频领域内进行音乐生成的基准测试项目,利用Freesound Loop数据集。
GPT 4o 是一种更强大的模型,能够实现实时音视频响应和情感音频输出,用户可以免费使用此项目。
AudioCraft是一个音频类生成式AI项目,由MusicGen、AudioGen和EnCodec三种模型组成,支持多种音频处理任务,具有强大的音频生成能力,并且是一个开源项目。
DevMind是一个集成各种AI能力的创意平台,支持聊天补全、图像生成、人脸交换、语音转换、吉祥物创建、魔法头像、二维码艺术、视觉AI、图像放大等功能,现阶段可免费使用。
Meta的MusicGen及其微调模块的cog实现,可用于音乐生成,并支持自定义数据集进行微调。该项目使用户能够生成高质量的音乐,并根据特定需求调整模型,以创造出符合个人风格的音乐作品。
AI Music Creator: Text to Song 是一款基于人工智能的音乐创作应用,用户可以轻松选择多种音乐风格、情绪和乐器,在几秒钟内生成独特的免版权音乐曲目。
Starmony是一款基于人工智能的音乐创作平台,用户可以在几分钟内创作出独特的歌曲。通过其音乐智能技术,用户可以选择让AI完成创作,或者自己演唱或饶舌,配合数千种专业节拍,最后分享作品并开始赚取版权收益。