百聆是一个开源的语音对话助手,结合了语音识别 (ASR)、语音活动检测 (VAD)、大语言模型 (LLM) 和语音合成 (TTS) 技术,旨在通过语音与用户进行自然的对话。该项目可以在无需GPU的情况下实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆具有高效开源模型、模块化设计、支持记忆功能、工具调用和任务管理等特点,提供高质量的语音对话体验,端到端时延800ms。