Sigma是由微软AI开发的高效大语言模型,专注于系统领域任务,如AI基础设施优化、硬件诊断等。其核心创新是DiffQKV注意力机制,通过差异化优化Query、Key和Value组件,显著提升推理效率。模型在6万亿token(含19.5亿系统领域token)上预训练,在系统领域基准AIMICIUS上性能超越GPT-4达52.5%。