Baichuan-Audio是一个开源的端到端语音交互基础模型,旨在让机器真正“听懂”并“说好”人类语言。它支持高质量、可控的实时中英双语对话,并首次开源了音频理解与生成基准测试集OpenAudioBench,涵盖2701个数据点。通过采用两阶段训练策略,该模型在智能表现上得到了显著提升。