生成教科书质量的预训练数据