SuperGPQA开源项目 – 全面评估大语言模型的性能

SuperGPQA是字节的豆包团队推出的评测项目，旨在为大语言模型（LLM）提供全面的研究生级学科评估框架。该项目覆盖285个研究生学科，通过创新的人机协作过滤机制确保题目高质量，并提供详细的模型性能对比，助力模型优化。

SuperGPQA的特点:

1. 提供全面的评测框架
2. 支持多种模型评估
3. 易于集成和使用
4. 详细的性能分析报告
5. 覆盖285个研究生学科，全面评估模型的知识和推理能力
6. 创新的人机协作过滤机制，确保题目高质量
7. 提供详细的模型性能对比，助力模型优化

SuperGPQA的功能:

1. 用于模型性能评估
2. 作为模型优化的参考
3. 集成到现有的机器学习工作流中
4. 生成详细的评估报告
5. 用于评估大语言模型在研究生级学科中的知识和推理能力
6. 通过人机协作过滤机制生成高质量的评估题目
7. 进行模型性能对比，帮助优化和改进大语言模型

相关导航

Prompt Llama官网 – 高质量文本转图像提示生成工具

Prompt Llama是一个用于收集高质量文本到图像的提示，并测试不同模型在相同提示下的表现的平台。它为用户提供了一种便捷的方法，以获取和比较各种生成模型的效果，帮助创作者优化他们的提示语和生成结果。

GAOKAO-bench开源项目 – 利用高考题评估大语言模型的框架

GAOKAO-bench 是一个评估框架，使用中国高考题目作为数据集，用于评估大语言模型的表现。该框架包含多种题型，旨在全面测试模型的语言理解能力和逻辑推理能力。

LLMs-In-China开源项目 – 国内大语言模型信息平台

截至目前，国内已经有了个 188 大语言模型，LLMs-In-China 收录了中国境内的多种大语言模型信息，提供模型的基本参数和性能指标，包含模型的使用案例和应用场景，并支持用户提交新的模型信息。

ADHDtest.ai官网 – 基于AI的ADHD在线评估工具

ADHDtest.ai利用人工智能技术，提供一种创新的在线评估工具，旨在快速、准确地诊断注意缺陷多动障碍（ADHD），同时注重用户隐私。用户可以在家中舒适地回答测试问题，快速获取诊断结果。

ComfyUI InstantIR Wrapper开源项目 – 快速提升图片质量的工具

ComfyUI InstantIR Wrapper是一款集成于ComfyUI环境中的工具，旨在快速提升图片质量，修复模糊照片，并实现即时图像恢复。它特别适用于需要快速处理低质量图像的场景，支持盲图像恢复，能够在没有先验知识的情况下有效提升图像清晰度。

What LLM to use?开源项目 – 帮助开发者选择合适的LLM

关于开发者在使用大型语言模型(LLM)时选择哪个模型的视角的资源库，列举了当前开发者使用的一些开源和商业LLM，并提供了关于如何选择LLM的指南。

YuzukiLOHCC-PRO-低成本USB3.2Gen1 HDMI开源项目 – USB视频采集卡

YuzukiLOHCC-PRO是一款低成本的USB3.2Gen1 HDMI-USB视频采集卡，具备环出功能，适用于实时监控和视频捕获。该设备通过USB 3.2 Gen 1接口实现高速数据传输，支持HDMI输入，兼容多种操作系统，并且是开源硬件，鼓励社区贡献与改进。

Social Plans官网 – 为您定制个性化内容计划

Social Plans是一个基于Astro和TailwindCSS构建的起始网站模板，允许用户选择兴趣领域，由AI为其策划个性化和独特的内容计划，每周直接发送到您的邮箱。

Diffusion Policy开源项目 – 基于扩散模型的视动策略学习

Diffusion Policy 是一种利用扩散模型进行视动策略学习的方法，探索了扩散模型在策略学习中的应用。它提出了一种新的训练算法和架构，并在模拟和真实世界实验任务中表现出色，能够实现更高的成功率和更快速、更有效的学习。项目提供了完整的代码、实验数据和Google Colab笔记本，支持用户快速上手和复现实验结果。