LongWriter开源项目 – 超长文本生成AI模型
LongWriter是由清华大学和智普联合开源的一种超长输入、超长输出的AI模型,旨在通过超长上下文输入和超长答案输出来确保正确的答案隐藏在输出中。该模型通过构建包含更长文本的高质量训练数据集,显著提升了模型的长文生成能力。LongWriter开源了两个模型:THUDM/LongWriter-llama3.1-8b和THUDM/LongWriter-glm4-9b,并提供了试用空间进行测试。该模型能够生成连贯、逻辑性强的长篇文章,致力于释放长上下文LLM的10,000+字生成能力。