收集和梳理垂直领域的开源模型、数据集及评测基准,方便研究人员和开发者使用。
How2GenAI是一个强大的工具,提供最全面的GenAI框架和库,帮助用户获取量身定制的指导,访问精选资源、代码片段和特定于GenAI用例的设计模式。
Planetarium是一个用于评估大型语言模型将自然语言描述的规划问题转换为PDDL的基准测试工具,具备图同构的比较方法,旨在帮助研究人员分析和提升模型的性能。
这是一个精心策划的与DeepSeek Coder相关的开源项目列表,旨在为开发者提供丰富的资源和灵感。每个项目都附有详细的描述和链接,帮助开发者快速找到所需的信息。
这篇论文探讨了如何评估大模型的性能,包括评估的内容、地点和方法,并分析了当前评估方法的有效性和可信度。
Prompt2Model 是一个从自然语言指令生成可部署模型的工具,旨在帮助系统构建者通过自然语言描述任务并提供示例来创建自然语言处理系统。
katakomba是一个专为NetHack游戏设计的数据驱动的基准测试工具,提供超过30个标准化数据集,并支持多种基于循环的离线强化学习基线模型,旨在促进研究和开发中的基准测试。
My tools.ai是一个软件即服务平台,提供对话、音乐、图像和代码等AI内容生成工具,基于强大的语言模型如ChatGPT、Dalle-3和Replicate,帮助开发者和创作者轻松生成所需内容。
SuperCLUE是一个针对中文大模型的综合性基准测试平台,提供标准化的评估指标和多任务测试能力,旨在帮助研究者评估和比较中文大模型的性能。
深入探索精选的套壳站和必备API资源,为初学者和经验丰富的运营者提供一站式指南,涵盖常见问题解答和基础攻略
OutSystems是一种革命性的高性能低代码平台,帮助组织快速高效地开发和部署云原生应用,简化应用开发流程,提供强大的集成功能。
Free Chat GPT-4o Mini是一款先进且经济高效的AI模型,旨在为广泛应用提供高质量、易于获取的智能服务,适用于个人和商业需求。
检索增强大语言模型指南,旨在提供有关如何构建和使用检索增强的语言模型的全面信息和工具。