PRM800K数据集

PRM800K开源项目 – 提升大型语言模型推理能力的数据集

PRM800K开源项目 – 提升大型语言模型推理能力的数据集

PRM800K是一个用于训练过程监督奖励模型（PRM）的数据集，旨在提高大型语言模型在复杂推理任务中的准确性，尤其是在数学问题上。该数据集包含800K个步进级标签，覆盖12K个问题的75K个解决方案，使用主动学习技术选择最具信息量的数据样本进行人工注释，从而提供细粒度反馈，通过评估中间推理步骤来改进结果，最终提高解决率，从42.5%提升到78%在MATH数据集子集上。

PRM800K数据集RLHF技术主动学习大型语言模型推理

AI数学奥林匹克竞赛（AIMO）官网 – 促进AI模型在数学竞赛中的应用

旨在促进能在IMO竞赛中赢得金牌的开放共享AI模型诞生的比赛，设立于2023年11月。

AI数学竞赛Python代码验证开放共享AI模型数学推理

Awesome LLM Inference开源项目 – 强大的LLM推理工具集

Awesome LLM Inference开源项目 – 强大的LLM推理工具集

这是一个关于出色LLM推理的小集合，包含文献、博客和文档以及代码，支持TensorRT-LLM、流式LLM、SmoothQuant、WINT8/4、连续批处理、FlashAttention、PagedAttention等技术。

FlashAttentionLLM推理工具集PagedAttentionSmoothQuant

azure-openai-proxy开源项目 – Azure OpenAI服务的请求代理

azure-openai-proxy开源项目 – Azure OpenAI服务的请求代理

Azure OpenAI服务代理，将OpenAI官方API请求转换为Azure OpenAI API请求，支持GPT-4，简化了与Azure OpenAI服务的集成，并提供统一的API接口，方便开发者使用Azure的强大能力。

Azure OpenAI服务代理Azure集成工具GPT-4支持OpenAI API请求转换

Planetarium开源项目 – 评估语言模型规划能力的基准测试

Planetarium开源项目 – 评估语言模型规划能力的基准测试

Planetarium是一个用于评估大型语言模型将自然语言描述的规划问题转换为PDDL的基准测试工具，具备图同构的比较方法，旨在帮助研究人员分析和提升模型的性能。

PDDL转换工具模型性能分析语言模型评估工具

estimatooor官网 – 使用ChatGPT教你用简单数学猜答案

estimatooor是一个利用ChatGPT的工具，帮助用户通过简单的数学推理来解决看似复杂的问题。用户可以选择任何主题进行问题解决，适合需要快速估算或分析的场景。

ChatGPT工具快速估算数学推理问题解决

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3