标签:异构内存管理系统

DeepSpeed-FastGen:异构内存管理系统如何提升大模型推理效率

微软研究院开源的DeepSpeed-FastGen工具通过创新的动态序列批处理技术和异构内存管理系统,显著提升了大模型推理效率,降低了硬件成本。该工具在NVIDIA A100...