AI交流(进群备注:ComfyUI_SparkTTS)

ComfyUI_SparkTTS 是一个基于 Qwen2.5 构建的开源模型,专注于合成语音和语音克隆。它提供简单高效的语音生成解决方案,支持高质量语音克隆、双语生成以及语音参数的可控调整,适用于多种场景。
ComfyUI_SparkTTS的特点:
- 1. 简单高效:完全基于 Qwen2.5 构建,无需额外生成模型,直接从 LLM 预测的代码中重建音频。
- 2. 高质量语音克隆:支持零样本语音克隆,无需特定训练数据即可复制说话者的语音。
- 3. 双语支持:支持中英文,适用于跨语言和代码切换场景的语音克隆。
- 4. 语音生成可控:支持调整性别、音调、语速等参数,创建虚拟说话人。
ComfyUI_SparkTTS的功能:
- 1. 用于跨语言和代码切换场景的语音合成。
- 2. 用于创建虚拟说话人,调整性别、音调、语速等参数。
- 3. 用于高质量语音克隆,复制特定说话者的语音。
- 4. 用于中英文双语语音生成,实现高自然度和准确性的语音合成。
相关导航
暂无评论...