Intel研究院开源的AI模型优化工具,支持将千亿参数大模型压缩至1/20体积,在Intel第四代至强处理器上实现3.8倍推理加速,量化精度损失<0.5%。该工具提供统一API,支持主流深度学习框架(如TensorFlow、PyTorch、ONNX Runtime和MXNet)上的模型压缩技术,包括量化、剪枝、蒸馏和神经架构搜索。