所有AI工具AI学习网站AI开发框架AI开源项目

GAOKAO-bench开源项目 – 利用高考题评估大语言模型的框架

GAOKAO-bench 是一个评估框架,使用中国高考题目作为数据集,用于评估大语言模型的表现。该框架包含多种题型,旨在全面测试模型的语言理解能力和逻辑推理能力。

标签:

AI交流(进群备注:GAOKAO-bench)

GAOKAO-bench 是一个评估框架,使用中国高考题目作为数据集,用于评估大语言模型的表现。该框架包含多种题型,旨在全面测试模型的语言理解能力和逻辑推理能力。

GAOKAO-bench的特点:

  • 1. 使用中国高考题目作为数据集
  • 2. 评估语言理解和逻辑推理能力
  • 3. 包含1781道选择题
  • 4. 包含218道填空题
  • 5. 包含812道作文题

GAOKAO-bench的功能:

  • 1. 评估大语言模型在中文任务上的表现
  • 2. 基准测试语言理解和逻辑推理能力
  • 3. 在标准化测试数据集上比较不同模型
  • 4. 开发和测试新的模型评估方法

相关导航

暂无评论

暂无评论...