seed-tts-eval是字节跳动开发的Seed-TTS模型的客观评估工具,包含用于评估零样本语音生成能力的测试集和指标计算脚本。该项目不发布Seed-TTS的源代码和模型权重,但提供了从公开语料库中提取的测试样本,用于衡量模型在多种客观指标上的表现。测试集包括来自Common Voice和DiDiSpeech-2数据集的样本,并采用WER(词错误率)和SIM(说话人相似度)作为评估指标。