所有AI工具AI开发框架AI开源项目AI音频工具

ComfyUI_SparkTTS开源项目 – 高效语音生成与克隆

ComfyUI_SparkTTS 是一个基于 Qwen2.5 构建的开源模型,专注于合成语音和语音克隆。它提供简单高效的语音生成解决方案,支持高质量语音克隆、双语生成以及语音参数的可控调整,适...

标签:

AI交流(进群备注:ComfyUI_SparkTTS)

ComfyUI_SparkTTS 是一个基于 Qwen2.5 构建的开源模型,专注于合成语音和语音克隆。它提供简单高效的语音生成解决方案,支持高质量语音克隆、双语生成以及语音参数的可控调整,适用于多种场景。

ComfyUI_SparkTTS的特点:

  • 1. 简单高效:完全基于 Qwen2.5 构建,无需额外生成模型,直接从 LLM 预测的代码中重建音频。
  • 2. 高质量语音克隆:支持零样本语音克隆,无需特定训练数据即可复制说话者的语音。
  • 3. 双语支持:支持中英文,适用于跨语言和代码切换场景的语音克隆。
  • 4. 语音生成可控:支持调整性别、音调、语速等参数,创建虚拟说话人。

ComfyUI_SparkTTS的功能:

  • 1. 用于跨语言和代码切换场景的语音合成。
  • 2. 用于创建虚拟说话人,调整性别、音调、语速等参数。
  • 3. 用于高质量语音克隆,复制特定说话者的语音。
  • 4. 用于中英文双语语音生成,实现高自然度和准确性的语音合成。

相关导航

暂无评论

暂无评论...