所有AI工具AI开发框架AI开源项目AI音频工具

FunASR开源项目 – 端到端语音识别工具包

FunASR 是一个旨在连接学术研究与工业应用的语音识别工具包。它支持工业级语音识别模型的训练与微调,帮助研究者和开发者更方便地进行语音识别模型的研究与生产,推动语音识别生态...

标签:

AI交流(进群备注:FunASR)

FunASR 是一个旨在连接学术研究与工业应用的语音识别工具包。它支持工业级语音识别模型的训练与微调,帮助研究者和开发者更方便地进行语音识别模型的研究与生产,推动语音识别生态的发展。FunASR 提供了丰富的预训练模型和便捷的脚本与教程,支持推理和微调,涵盖语音识别、语音活动检测、标点恢复、语言模型、说话人验证、说话人分离等多种功能。

FunASR的特点:

  • 1. 支持多种语音识别任务,如语音识别、语音活动检测、标点恢复等
  • 2. 提供丰富的预训练模型,涵盖学术和工业数据
  • 3. 支持模型推理和微调,方便快速部署
  • 4. 支持实时和非实时的语音识别
  • 5. 提供多种语言的语音识别模型

FunASR的功能:

  • 1. 通过命令行进行语音识别
  • 2. 使用 Python API 进行语音识别、语音活动检测等任务
  • 3. 部署为实时或离线的语音识别服务
  • 4. 支持模型的 ONNX 导出与测试
  • 5. 提供多种语言的语音识别模型,如中文、英文等

相关导航

暂无评论

暂无评论...