多语言视觉文本生成