Orion-14B 系列模型是一个具有140亿参数的多语种大模型,基于包含2.5万亿token的多样化数据集进行训练,涵盖中文、英语、日语、韩语等多种语言。该系列包括多种衍生模型,如对话模型、长文本模型、量化模型、RAG微调模型、Agent微调模型等,适用于多种自然语言处理任务。