微软推出的高效小语言模型架构,专为10亿参数以下的模型设计,助力小模型在性能和效率上赶超大模型。通过优化基础架构和知识蒸馏技术,显著提升模型性能,降低推理延迟和内存计算成本,适用于边缘设备等资源受限场景。