语音输入生成模型