高效压缩MoE大模型

D²-MoE是一种专为基于Mixture of Experts（MoE）的大型语言模型（LLM）设计的高效压缩方案。通过其独特的Delta Decompression技术，该方案能够在无需额外训练的情况下显著减少模型参数，同时保持模型的性能。D²-MoE支持多种模型架构，如Mixtral和DeepSeek，具有广泛的适用性。

Delta Decompression技术开源项目高效压缩MoE大模型

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。