所有AI工具AI学习网站AI开发框架

SuperBPE官网 – 提升语言模型效率的分词算法

SuperBPE 是一种创新的分词算法,扩展了传统的字节对编码(BPE),通过学习跨越空格的‘超词’分词,显著提高了语言模型的编码效率和性能。它通过两阶段预分词课程,首先学习子词,...

标签:

AI交流(进群备注:SuperBPE)

SuperBPE 是一种创新的分词算法,扩展了传统的字节对编码(BPE),通过学习跨越空格的‘超词’分词,显著提高了语言模型的编码效率和性能。它通过两阶段预分词课程,首先学习子词,然后学习超词,从而在固定词汇量下减少最多 33% 的分词数量,并在 30 个下游任务中平均提升 4.0% 的表现,推理时间计算量减少 27%。

SuperBPE的特点:

  • 1. 学习‘超词’分词,涵盖多词表达和跨语言概念
  • 2. 两阶段预分词课程:先学习子词,再学习超词
  • 3. 在固定词汇量下减少最多 33% 的分词数量
  • 4. 在 30 个下游任务中平均提升 4.0% 的表现
  • 5. 推理时间计算量减少 27%

SuperBPE的功能:

  • 1. 通过 HuggingFace Transformers 使用 SuperBPE 分词器进行模型训练和推理
  • 2. 通过 vLLM 平台进行高效推理,适合大规模部署
  • 3. 适用于知识推理、阅读理解和常识推理等下游任务
  • 4. 无需修改底层模型架构,作为传统 BPE 的无缝替代方案

相关导航

暂无评论

暂无评论...