Audiocraft是Meta(原Facebook)发布的一个基于PyTorch的深度学习库,专注于音频生成研究。它提供了MusicGen模型,能够通过文本描述或旋律提示生成高质量的音乐。MusicGen采用单级自回归Transformer架构,并使用32kHz EnCodec分词器进行训练,支持高效的音乐生成。模型经过2万小时正版授权音乐的训练,生成的曲子旋律、节奏和音色自然流畅,适用于多种场景。
Orb Producer是一个全面且创新的AI驱动插件套件,旨在帮助音乐制作人轻松创建高质量的音乐模式和循环。该套件包含四个插件:Orb Melody、Orb Bass、Orb Arpeggios和Orb Synth,每个插件都提供独特的功能和能力。
AudioCraft是一个基于深度学习的音频处理与生成库,旨在提供先进的音频压缩、生成和实验功能。
AI Music Generator (AMG) 是一个由Meta的AudioCraft提供支持的平台,用户只需用文字描述即可生成音频片段和音乐。它可以创建最长30秒的音频片段,并提供稳定的音频扩散功能。生成的内容可以下载。
Stable Audio是由Stability AI开发的生成性AI工具,用户可以通过文本提示和持续时间生成高质量的音频,采样率为44.1 kHz立体声。
Meta的MusicGen及其微调模块的cog实现,可用于音乐生成,并支持自定义数据集进行微调。该项目使用户能够生成高质量的音乐,并根据特定需求调整模型,以创造出符合个人风格的音乐作品。
Voice Swap是由DJ FRESH和NICO PELLERIN开发的创新AI工具,旨在帮助制作人、艺术家和作家在不使用自己声音的情况下进行音乐创作。它利用人工智能技术,巧妙地将音频转换为类似于知名艺术家的独特声音,推动音乐创作的边界。
AudioGPT是一个基于大语言模型(LLM)的开源项目,专注于音频的理解与生成。它提供多种音频处理和生成功能,涵盖语音、音乐、声音的合成与识别,支持多模态音频处理,适用于多种音频格式。AudioGPT旨在拓展音频技术的应用场景,如语音助手开发、音乐创作、语音识别与合成、音频内容生成、声音特效制作等。
VisionCrafter是一个具有图形用户界面的工具,支持AnimateDiff和其他项目,能够从文本生成动画和音乐。它非常适合制作短视频和GIF,以及创建简短的电影场景。
Stable Audio Open是一个优化的开源模型,旨在使用文本提示生成短音频样本、音效和制作元素,能够从简单的文本输入创建最长47秒的高质量音频数据。
Story321 Music AI 是一个利用人工智能根据简单提示生成专业音乐的工具和平台,帮助用户在没有丰富音乐知识的情况下创建高质量的音乐。用户只需选择音乐类型,输入描述,点击'生成',即可等待AI创造音乐。
Phraser是一个利用AI技术的协作创意工具,能够轻松创建各种类型的内容,包括照片、设备、服装、艺术、设计和渲染风格的图像。它运用机器学习和生成性AI算法,为时尚、音乐等创意领域提供解决方案,旨在为用户带来未来的内容创作体验。
Muzic是一个基于深度学习的AI音乐项目,能够自动完成音乐创作,主要分为音乐理解和音乐合成两个过程。它通过符号分类和声音识别来理解音乐,并能够创作出歌词和旋律,支持自动化的音乐创作,极大地方便了音乐创作者。
Bark with Voice Clone 是一个支持音色克隆的文本到音频生成工具,能够处理中文文本,并允许用户根据自定义音频/文本对生成音频。该项目结合了生成音频模型和音色克隆技术,提供丰富的音频创作可能性。
Speechson是一个在线文本到声音的TTS工具,利用深度学习算法将书面文本转换为自然声音,提供超过900种AI声音和144种语言的支持。
基于 PyTorch 的音乐生成和文本到语音(TTS)系统的实现,该系统使用基于 LLaMA 的大型语言模型(LLMs),并支持在单个 RTX 4090 GPU 上少于 10 小时内训练音乐生成模型
Udio是一个先进的AI音乐生成器,旨在简化音乐创作过程,使其对初学者和专业人士都可及。用户可以通过简单的文本提示创建专业质量的音乐作品。
该项目能够根据上传的音乐文件生成对应的视觉图像,适用于视频制作和艺术创作,能够将音乐与视觉艺术结合,为创意项目提供灵感。