CosyVoice是阿里巴巴通义实验室开发的语音生成工具,支持多语言与跨语言生成、零样本语音克隆、双向流式语音合成、富文本与情感控制等功能。适用于直播、客服等对响应速度要求极高的场景。CosyVoice 2.0版本在1.0的基础上提供了更准确、更稳定、更快速、更高质量的语音生成能力。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型