Vox Box 是一个兼容 OpenAI API 的文本转语音和语音转文本服务器,支持 Whisper、FunASR、Bark 和 CosyVoice 等后端模型。它能够处理多种语言和应用场景,提供广泛的语音选项,满足多样化的语音合成需求,并能够无缝集成到现有的 AI 工作流程中。