PDDL转换工具

Planetarium开源项目 – 评估语言模型规划能力的基准测试

Planetarium开源项目 – 评估语言模型规划能力的基准测试

Planetarium是一个用于评估大型语言模型将自然语言描述的规划问题转换为PDDL的基准测试工具，具备图同构的比较方法，旨在帮助研究人员分析和提升模型的性能。

PDDL转换工具模型性能分析语言模型评估工具

Awesome Domain LLM开源项目 – 垂直领域的开源资源汇聚

Awesome Domain LLM开源项目 – 垂直领域的开源资源汇聚

收集和梳理垂直领域的开源模型、数据集及评测基准，方便研究人员和开发者使用。

开源模型资源数据集整合模型评测基准研究开发支持

大语言模型微调技术笔记开源项目 – 总结大语言模型微调技术

大语言模型微调技术笔记开源项目 – 总结大语言模型微调技术

该项目总结了大语言模型的微调技术，探讨了指令微调和对齐微调的方法，旨在提升模型在特定任务上的表现。

大语言模型微调对齐微调微调技术研究指令微调

flash-attention开源项目 – 基于FlashAttention的高效Transformer实现

flash-attention开源项目 – 基于FlashAttention的高效Transformer实现

flash-attention是一个基于FlashAttention优化的Transformer实现，其训练速度在GPT2和GPT3上比Huggingface的实现快3-5倍，显著提升了训练效率，同时优化了内存使用，并支持多种硬件加速。

FlashAttentionHuggingFace集成深度学习训练速度优化

LangSmith官网 – 助力开发者从原型到生产

LangSmith是一个旨在帮助开发者缩小原型与生产之间差距的平台，专为构建和迭代能够利用大型语言模型(LLMs)的产品而设计，既能发挥其强大能力，又能应对其复杂性。

LLM集成产品迭代快速原型开发模型性能优化

Topology for Machine Learning开源项目 – 拓扑方法提升机器学习能力

Topology for Machine Learning开源项目 – 拓扑方法提升机器学习能力

拓扑机器学习教程：面向从业者的拓扑方法，利用代数拓扑技术分析复杂数据结构，捕捉传统机器学习方法可能无法捕捉的特征

复杂数据分析拓扑数据分析机器学习模型增强特征提取

TransferAttack开源项目 – 提升图像分类对抗性传递的框架

TransferAttack开源项目 – 提升图像分类对抗性传递的框架

TransferAttack是一个基于PyTorch的框架，旨在提升图像分类中的对抗性传递性，提供评估和攻击模型的功能，并对已有的传递性攻击进行分类和评估。

PyTorch图像分类传递性攻击分析对抗性攻击框架模型评估工具

Aide.dev官网 – AI驱动的编程助手

Aide.dev 是一款创新的AI工具，旨在提升开发者的编码体验，通过智能的代码补全和实时聊天支持，使编码过程更加高效和互动，同时确保代码隐私。

AI驱动的编程助手VSCode集成实时聊天支持开源AI模型

fmeval开源项目 – 评估大型语言模型性能的工具

fmeval开源项目 – 评估大型语言模型性能的工具

Amazon Foundation Model Evaluations Library，用于评估大型语言模型（LLMs），帮助选择最适合您用例的LLM。该库提供多种评估功能，覆盖开放式生成、文本摘要、问答和分类任务，旨在帮助用户全面了解不同模型在特定任务上的表现。

LLM性能评估工具分类任务评估开放式生成任务评估文本摘要评估

PRM800K开源项目 – 提升大型语言模型推理能力的数据集

PRM800K开源项目 – 提升大型语言模型推理能力的数据集

PRM800K是一个用于训练过程监督奖励模型（PRM）的数据集，旨在提高大型语言模型在复杂推理任务中的准确性，尤其是在数学问题上。该数据集包含800K个步进级标签，覆盖12K个问题的75K个解决方案，使用主动学习技术选择最具信息量的数据样本进行人工注释，从而提供细粒度反馈，通过评估中间推理步骤来改进结果，最终提高解决率，从42.5%提升到78%在MATH数据集子集上。

PRM800K数据集RLHF技术主动学习大型语言模型推理

DataAug4NLP开源项目 – NLP数据增强文献集

DataAug4NLP开源项目 – NLP数据增强文献集

该项目是一个关于自然语言处理(NLP)数据增强的文献集，收录了多篇相关研究论文和技术资源，旨在为研究人员和开发者提供最新的NLP数据增强方法和应用实例，促进相关领域的研究和开发。

NLP数据增强文献集数据增强技术研究资源自然语言处理研究

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3