LiveTalking 是一个基于 PyTorch 框架的实时交互流式数字人项目,旨在实现音视频同步对话。它整合了 ER-NeRF、MuseTalk 和 Wav2Lip 等先进模型,利用神经辐射场技术,通过音频输入生成逼真的数字人表情和动作。项目支持声音克隆、数字人被打断、全身视频拼接等功能,适用于多种实时交互场景。