优化的多头自注意力实现