AI交流(进群备注:west)

west是一款基于大型语言模型(LLM)的语音转录系统,仅用300行代码实现。它支持多种LLM和语音编码器,如LLaMA、QWEN、Whisper等,具有高性能和高准确率的语音转录能力。通过模块化设计,west由LLM、语音编码器和可训练的投影器组成,仅需训练投影器,提高了训练效率。
west的特点:
- 1. 代码简洁:代码量不到 300 行
- 2. 灵活可扩展:支持多种LLM和语音编码器,如LLaMA、QWEN、Whisper等
- 3. 高性能:基于LLM实现高准确率的语音转录
- 4. 模块化设计:由LLM、语音编码器和可训练的投影器组成,只训练投影器,提高训练效率
- 5. 支持自定义训练
- 6. 支持自定义解码
west的功能:
- 1. 语音转录:将语音转换为文本
- 2. 支持多种LLM和语音编码器的集成
- 3. 高效训练:通过模块化设计,仅需训练投影器,提升训练效率
- 4. 适用于需要高准确率语音转录的场景
- 5. 自定义模型训练
- 6. 自定义解码策略
相关导航
暂无评论...