OpenAI Realtime API 是一款专为开发者设计的实时语音交互API,支持低延迟、多模态体验,特别适用于语音到语音的实时对话。该API集成了大型语言模型如 GPT-4,支持文本和音频的输入输出,并通过WebSockets实现实时流媒体功能。它减少了传统方法中因使用多个模型而导致的延迟,保留了对话的自然情感和流畅性。