所有AI工具AI学习网站AI对话工具AI开发框架AI开源项目

混元Large开源项目 – 高性能大规模语言模型

混元Large是一个总参数量达到389B,激活参数量为52B的大规模语言模型,支持256K的上下文长度。在常识理解、推理任务和传统NLP任务中表现优异,尤其在数学能力方面,在GSM8K和MATH...

标签:

AI交流(进群备注:混元Large)

混元Large是一个总参数量达到389B,激活参数量为52B的大规模语言模型,支持256K的上下文长度。在常识理解、推理任务和传统NLP任务中表现优异,尤其在数学能力方面,在GSM8K和MATH数据集上表现突出。

混元Large的特点:

  • 1. 总参数量389B,激活参数量52B
  • 2. 256K上下文
  • 3. 在常识理解、推理和传统NLP任务表现优秀
  • 4. 数学能力在GSM8K和MATH数据集上优秀

混元Large的功能:

  • 1. 自然语言处理任务
  • 2. 常识理解
  • 3. 推理任务
  • 4. 数学问题解决

相关导航

暂无评论

暂无评论...