这款开源(open-weight)的文本转音频模型可根据文本提示生成 44.1kHz 的高质量立体声音频。它非常适合合成逼真的声音和现场录音,可以运行在消费级 GPU 上,因此非常适合学术研究和艺术用途。
XTTS 是一个开源文本到语音(TTS)项目,旨在提供高质量的语音合成,支持多种语言,适用于不同的应用场景,如语音助手和有声书制作。
Sketch2Sound 是一种生成音频模型,通过时变信号和声音模仿实现音频生成,能够从一组可解释的时变控制信号创建高质量的声音。
Emvoice是一款利用先进人工智能技术生成逼真、富有表现力的声乐轨道的工具,适用于音乐制作人、内容创作者和音响工程师,简化了声乐音乐创作过程,无需现场歌手。
一个精心挑选的人工智能工具集合,涵盖文本、图像、音频和视频等多个领域,定期更新以包含最新的AI技术进展。
Voice Changer 是一款实时语音转换客户端,支持Windows和Mac。它可以实时变声成其他人或者虚拟角色的音色,可以接入多种语音转换技术。
ChatTTS Me 是一个将文本转化为自然流畅语音的平台,适用于聊天机器人和虚拟助手,提供优化和富有表现力的对话体验。
GPT Core用于创建和训练先进的大型语言模型(LLM),着重强调了其快速性能,可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失。