Nanospeech 是一个基于 PyTorch 和 MLX 的研究导向型文本转语音(TTS)系统,具有模型小巧(82M参数)、训练高效(单卡H100几天完成)和生成速度快(3-5倍实时)的特点。支持语音匹配功能,提供多种内置语音选项,并兼容多GPU训练和流式数据加载。