所有AI工具AI音频工具
Kokoro 82M官网 – 高质量的文本转语音模型
Kokoro 82M 是一个高质量的 TTS 模型,能够生成极高音频质量的语音,同时模型大小不到 300M,便于部署和使用。该模型在 T4 上能够快速生成语音,并支持通过架构训练其他语言,且只...
标签:AI音频工具Hugging Face演示 TTS模型 语音合成 高质量文本转语音模型AI交流(进群备注:Kokoro 82M)

Kokoro 82M 是一个高质量的 TTS 模型,能够生成极高音频质量的语音,同时模型大小不到 300M,便于部署和使用。该模型在 T4 上能够快速生成语音,并支持通过架构训练其他语言,且只需不到 100 小时的音频数据进行训练。
Kokoro 82M的特点:
1. 生成音频质量高
2. 模型大小小于 300M
3. 在 T4 上快速生成语音
4. 支持通过架构训练其他语言
5. 仅需不到 100 小时的音频数据进行训练
Kokoro 82M的功能:
1. 生成英文语音
2. 训练其他语言的 TTS 模型
3. 进行语音合成和文本转语音的应用
4. 在 Hugging Face 平台上进行模型演示
相关导航
暂无评论...