Phi-3.5-mini-instruct (128k)模型 – 轻量级高效指令生成模型
Phi-3.5-mini-instruct (128k) 是微软于2024年8月发布的轻量级语言模型,属于Phi-3系列。该模型专注于指令生成任务,具有3.8亿参数,支持128K超长上下文,训练数据达3.4T tokens。采用密集解码器-only Transformer架构,在512张H100-80G GPU上训练10天完成。支持22种语言,在推理任务上表现接近GPT-4水平,特别适合资源受限或延迟敏感的应用场景,如移动端部署和边缘计算。