Microsoft Olive开源 – AI模型优化工具
Microsoft Olive是一个由微软开发的开源AI模型优化工具,专注于简化机器学习模型的微调、转换、量化和优化过程。它特别适用于在云端和边缘设备(如CPU、GPU和NPU)上高效运行AI模型,尤其是小语言模型(SLM)。Olive基于ONNX(开放神经网络交换格式),能够自动组合优化技术,输出高效的模型,同时考虑准确性、延迟等约束条件。它提供了40多个内置优化组件,支持模型压缩、优化、微调和编译等技术,并与Hugging Face和Azure AI无缝集成,适合开发者在资源受限的边缘设备上快速构建和部署AI模型。