AI交流(进群备注:GAOKAO-bench)

GAOKAO-bench 是一个评估框架,使用中国高考题目作为数据集,用于评估大语言模型的表现。该框架包含多种题型,旨在全面测试模型的语言理解能力和逻辑推理能力。
GAOKAO-bench的特点:
- 1. 使用中国高考题目作为数据集
- 2. 评估语言理解和逻辑推理能力
- 3. 包含1781道选择题
- 4. 包含218道填空题
- 5. 包含812道作文题
GAOKAO-bench的功能:
- 1. 评估大语言模型在中文任务上的表现
- 2. 基准测试语言理解和逻辑推理能力
- 3. 在标准化测试数据集上比较不同模型
- 4. 开发和测试新的模型评估方法
相关导航
暂无评论...