标签:对称Transformer架构

对称Transformer架构在GLM-4-9B模型中的应用与优化

GLM-4-9B是一款具有90亿参数规模的AI大模型,创新地采用了对称Transformer架构,显著提升了训练和推理效率。该模型在多任务场景中表现出色,支持生成-填充混...