标签：分页KV缓存

FlashMLA：开源AI优化新标杆，Hopper GPU性能革命

DeepSeek在2025年开源周期间发布的FlashMLA，是一款专为Hopper GPU优化的高效MLA解码内核，支持BF16和分页KV缓存，显著提升AI模型的训练和推理性能，适用于医...

AI快讯

4个月前

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。