MetaVoice-1B 是一个拥有1.2亿参数的文本转语音(TTS)模型,专注于生成情感丰富、节奏自然和音调准确的英语语音。它支持零样本克隆美国与英国口音,并支持跨语言的声线定制。模型基于100K小时的语音数据进行训练,支持任意长度文本的合成,并提供了丰富的API和Web UI供用户使用。项目采用Apache 2.0开源许可,用户可以无限制地使用。