Zonos-v0.1是一款全新开源语音合成模型,支持高质量语音克隆和精细控制。它能够在短时间内通过10-30秒的声音样本实现高质量的语音克隆,并支持中英日法德五国语言。此外,Zonos-v0.1还提供了精准的语速、音调、高频段、音质和情感调控功能。在4090显卡上实测,其生成速度是实时音频的2倍,适用于多种语音合成场景。