标签:多任务优化

对称Transformer架构在GLM-4-9B模型中的应用与优化

GLM-4-9B是一款具有90亿参数规模的AI大模型,创新地采用了对称Transformer架构,显著提升了训练和推理效率。该模型在多任务场景中表现出色,支持生成-填充混...

GLM-4-9B:多任务优化的AI大模型新星

GLM-4-9B是一款具备90亿参数规模的自适应AI大模型,采用对称Transformer架构,优化了生成-填充混合任务能力,适用于医疗、金融、跨语言搜索等多领域。其参数...