标签:扩散大语言模型

扩散大语言模型(dLLM):Mercury Coder 如何颠覆文本生成技术?

Inception Labs 发布的 Mercury Coder 是首个商用规模的扩散大语言模型(dLLM),在 NVIDIA H100s 上实现了每秒超过 1000 个 token 的处理速度。本文将深入探...