所有AI工具AI开发框架AI开源项目AI音频工具

west开源项目 – 简洁高效的语音转录系统

west是一款基于大型语言模型(LLM)的语音转录系统,仅用300行代码实现。它支持多种LLM和语音编码器,如LLaMA、QWEN、Whisper等,具有高性能和高准确率的语音转录能力。通过模块化...

标签:

AI交流(进群备注:west)

west是一款基于大型语言模型(LLM)的语音转录系统,仅用300行代码实现。它支持多种LLM和语音编码器,如LLaMA、QWEN、Whisper等,具有高性能和高准确率的语音转录能力。通过模块化设计,west由LLM、语音编码器和可训练的投影器组成,仅需训练投影器,提高了训练效率。

west的特点:

  • 1. 代码简洁:代码量不到 300 行
  • 2. 灵活可扩展:支持多种LLM和语音编码器,如LLaMA、QWEN、Whisper等
  • 3. 高性能:基于LLM实现高准确率的语音转录
  • 4. 模块化设计:由LLM、语音编码器和可训练的投影器组成,只训练投影器,提高训练效率
  • 5. 支持自定义训练
  • 6. 支持自定义解码

west的功能:

  • 1. 语音转录:将语音转换为文本
  • 2. 支持多种LLM和语音编码器的集成
  • 3. 高效训练:通过模块化设计,仅需训练投影器,提升训练效率
  • 4. 适用于需要高准确率语音转录的场景
  • 5. 自定义模型训练
  • 6. 自定义解码策略

相关导航

暂无评论

暂无评论...