PengChengStarling是基于icefall项目开发的多语言语音识别(ASR)模型,支持8种语言,模型参数仅3.08亿(Whisper-Large v3的20%),推理速度比Whisper快7倍。提供从音频输入到文本输出的完整ASR流程,适用于实时场景和资源受限环境。技术层面结合k2-fsa和lhotse框架,可能是针对多语言优化的定制版本。
PengChengStarling是一个基于icefall项目的多语言自动语音识别(ASR)模型,支持8种语言,模型大小仅为Whisper-Large v3的20%,推理速度提升7倍,并提供完整的ASR流程支持。该项目适合实时转录和语音到文本应用,具有高效、快速和低资源需求的特点。