AI交流(进群备注:源2.0)

源2.0是浪潮信息发布的新一代基础语言大模型,开源了102B、51B和2B三个模型版本。该模型在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,增强了在语义、数学、推理、代码、知识等方面的理解能力。提供了预训练、微调、推理服务的相关脚本,支持多种部署方式,包括Hugging Face、TensorRT-LLM、FastChat等框架。
源2.0的特点:
- 1. 支持102B、51B和2B三种参数规模
- 2. 增强的语义、数学、推理、代码、知识理解能力
- 3. 提供预训练、微调、推理服务的相关脚本
- 4. 支持多种部署方式,包括Hugging Face、TensorRT-LLM、FastChat等
- 5. 支持商用,无需申请授权
- 6. 支持流水线并行+优化器参数并行+数据并行的训练策略
源2.0的功能:
- 1. 通过Hugging Face下载和使用模型
- 2. 使用TensorRT-LLM进行推理服务部署
- 3. 使用FastChat框架进行多轮对话微调
- 4. 通过源Chat快速构建对话应用
- 5. 使用预训练和微调脚本进行模型开发
- 6. 通过API调用进行模型推理
相关导航
暂无评论...