这是一个基于ByteDance的MegaTTS3模型的ComfyUI自定义节点,提供高质量的文本到语音合成功能,支持中英双语和语音克隆。 项目通过ComfyUI的工作流界面实现语音生成和克隆,支持参数调优、GPU资源优化和自动模型下载等功能。 用户可以通过提供简短的语音样本(WAV和NPY文件)克隆任何声音,并精细控制发音质量、语音相似度等参数。
HaiLuo Voice AI 是由 MiniMax 开发的语音 AI 产品,采用 T2A-01-HD 模型,支持 17 种语言和超过 300 种音色。该产品能够生成最多 10,000 字的语音,质量经过严格测试,适用于各种复杂场景。用户可以自定义语音参数,如情感、语速、音高和音色效果。此外,它还支持语音克隆,只需 10 秒音频即可捕捉语音的细微差别和情感底色,适合电影配音、有声书制作和高端虚拟助手的专业应用。
AudiofyText是一个文本转语音转换器,能够将书面文本转化为多种语言的自然声音音频文件。
Tiktok AI Voice是一个网站,允许用户将文本转换为在TikTok上使用的流行语音。用户可以从多种独特的语音音调中进行选择,并将生成的语音以MP3文件下载。该工具支持快速生成,音质清晰。
Voicely是一个在线文本转语音工具,支持超过60种语言和500多种声音选项,能够将文本转化为自然流畅的语音,适用于多种场景和需求。
Fish Speech 1.4 是一个经过 700K 小时语音训练的开源文本转语音模型,支持多种语言,并提供即时语音克隆,具备超低延迟,约1GB的模型重量,模型权重可在Hub上获取。
OpenVoice 是一个由 MyShell 与 MIT 联合开发的开源文本转语音模型,支持多语言语音克隆与合成。其最新版本 OpenVoice V2 仅需一小段人声即可克隆语音,并提供细粒度控制功能,适用于语音助手、游戏角色语音、多语言音频内容生成等多种场景。
VoiceBar是一个先进的文本转语音(TTS)工具,能够生成逼真的人声,适用于多种场景。用户可以通过简单的操作,利用AI语音生成器创建自然流畅的语音,广泛应用于语音邮件、IVR系统、多语言文本转语音、短视频、说明视频及学习等领域。
AnyToSpeech是一个在线文本转语音转换器,允许用户将文本、PDF、文档、扫描图像和网址转换为语音。它提供多种语言的真实声音,为从文本内容生成音频提供了简洁明了的解决方案。
ttsopenai.com是一个将PDF和电子书转换为有声书或MP3文件的在线平台。用户只需上传文件,选择语音和速度,即可生成音频内容,方便随时收听。
Podurama是一款可在iOS、Android、网页、Windows和macOS上使用的免费播客应用,用户可以收听免费的播客、添加自定义RSS源,并在移动和桌面设备上上传私人音频文件。Podurama拥有超过200万个播客和数百万个可用的剧集,用户可以发现和探索各种内容。
Fix Dubs 是一个提供内容配音服务的平台,能够生成与原内容时长一致的配音版本。用户可以下载生成的 MP3 文件,或使用嵌入代码将其集成到自己的网站中。
基于ChatTTS的语音合成工具,支持音色抽卡、长音频生成和分角色朗读,简单易用,无需复杂安装。
Cliptics 是一个在线文本转语音服务,可以将文本转换为自然流畅的语音,提供无缝的用户体验。用户只需输入文本,选择语音,然后点击“生成语音”按钮即可将文本转换为语音。同时,用户可以根据个人喜好自定义语言和口音。
Bark with Voice Clone 是一个支持音色克隆的文本到音频生成工具,能够处理中文文本,并允许用户根据自定义音频/文本对生成音频。该项目结合了生成音频模型和音色克隆技术,提供丰富的音频创作可能性。
Leelo是一个利用先进AI技术将书面文字转换为生动音频的工具,用户可以从142种语言和口音中选择超过800种声音,非常适合制作演示文稿、营销视频和有声书的音频版本。
Audyo是一个前沿工具,利用人工智能将文本转换为逼真的音频内容,适用于视频、播客和有声书等多种应用,尤其以其名人模仿功能而闻名。