所有AI工具AI对话工具AI开发框架AI开源项目AI编程工具

源2.0开源项目 – 新一代基础语言大模型

源2.0是浪潮信息发布的新一代基础语言大模型,开源了102B、51B和2B三个模型版本。该模型在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,增强了在语义、数学、推...

标签:

AI交流(进群备注:源2.0)

源2.0是浪潮信息发布的新一代基础语言大模型,开源了102B、51B和2B三个模型版本。该模型在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,增强了在语义、数学、推理、代码、知识等方面的理解能力。提供了预训练、微调、推理服务的相关脚本,支持多种部署方式,包括Hugging Face、TensorRT-LLM、FastChat等框架。

源2.0的特点:

  • 1. 支持102B、51B和2B三种参数规模
  • 2. 增强的语义、数学、推理、代码、知识理解能力
  • 3. 提供预训练、微调、推理服务的相关脚本
  • 4. 支持多种部署方式,包括Hugging Face、TensorRT-LLM、FastChat等
  • 5. 支持商用,无需申请授权
  • 6. 支持流水线并行+优化器参数并行+数据并行的训练策略

源2.0的功能:

  • 1. 通过Hugging Face下载和使用模型
  • 2. 使用TensorRT-LLM进行推理服务部署
  • 3. 使用FastChat框架进行多轮对话微调
  • 4. 通过源Chat快速构建对话应用
  • 5. 使用预训练和微调脚本进行模型开发
  • 6. 通过API调用进行模型推理

相关导航

暂无评论

暂无评论...