StarCoder 2是一系列先进的代码生成模型,支持超过600种编程语言以及自然语言文本,如维基百科、Arxiv和GitHub问题。这些模型采用了分组查询注意力机制,拥有16384 token的上下文窗口和4096 token的滑动窗口注意力。其中,3B和7B模型经过3万亿token的训练,15B模型则经过4万亿token的训练,使其在代码生成和处理方面表现出色。