IPEX-LLM 是一个专为在 Intel Xeon 和 Arc GPU 系统上运行大型语言模型(如 DeepSeek-R1-671B-Q4_K_M)而设计的项目。它支持多种模型格式和量化技术,提供便携式部署方案,并优化性能以充分利用硬件资源。此外,IPEX-LLM 还支持多语言文档,包括中文,帮助用户快速上手和解决问题。