Clip.audio 是一个先进的AI音频搜索引擎,改变了用户发现、生成和混音音频的方式。它通过高级算法提供超过两百万种来自互联网的音频,支持多种音频格式,界面友好,适合各种创意项目。
uJam 是一个平台,用户可以通过 AI 将他们的音乐创意转化为真实的音乐,轻松实现音乐创作。
MusicLM将条件音乐生成过程视为分层序列到序列建模任务,并生成24kHz的音乐,能够在几分钟内保持一致。他们的实验表明,MusicLM比以前的系统在音频质量和对文本描述的坚持方面表现更优。此外,我们证明MusicLM可以在文本和旋律上进行调节,即它可以根据文本说明将吹口哨和哼唱的旋律转换为描述的风格。为了支持未来的研究,我们公开发布MusicCaps数据集,该数据集由5.5k音乐文本对组成,并提供了人工专家编写的丰富文本描述。
So-vits-svc(也称Sovits)是一款基于VITS、soft-vc、VISinger2等技术的开源免费AI语音转换软件。它能够快速学习目标声音特征,实现高质量的语音克隆与变声,适用于多种场景如AI配音、虚拟主播、音乐翻唱等。
Audiogen通过AI生成高质量音频,轻松制作多样化的声音,满足创作者的各种需求。
ExtendMusic.AI是一个基于AI的工具,旨在帮助音乐创作者增强和扩展其原创作品,生成新颖且富有灵感的音乐曲目。
Databass是一个旨在通过AI技术颠覆音频创作的工具,帮助创作者释放他们的音响创造力。它提供了丰富的音频创作工具和一个支持性强的社区,让用户能够轻松创建和分享高质量音频内容。
CassetteAI是一个基于人工智能的音乐创作平台,用户可以通过文本描述生成独特的音乐节拍,支持多种自定义选项,且生成的音乐为免版税。该平台与Polygon Studios和Pixl合作,提供NFT和增强现实体验。
Cugent是一款AI自动语音解说工具,可以将脚本快速转换为高质量的语音解说,支持多种语言和声音类型,用户可以轻松从PDF、文档或文本文件创建音频内容。
Robust Video Matting (RVM) 是一个基于PyTorch、TensorFlow、TensorFlow.js、ONNX和CoreML的强大视频抠图工具,能够提供高质量的抠图效果,并具备实时处理能力和良好的鲁棒性,适应各种视频条件。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型