CAM++ 是 FunClip 集成的语音识别模型,专注于中文语音识别,适用于 16k 采样率的通用场景。它能够自动识别说话者 ID,并用于剪辑特定说话者的段落。该模型具有高效、准确、轻量化的特点,适合实时应用和资源受限的环境。