毒化攻击

Poisoning Language Models During Instruction Tuning开源项目 – 针对语言模型的攻击方法

Poisoning Language Models During Instruction Tuning开源项目 – 针对语言模型的攻击方法

该项目实现了针对语言模型的攻击方法，特别是在指令调优过程中，旨在提高模型对恶意输入的鲁棒性，同时研究指令调优对模型性能的影响。

指令调优模型安全性研究模型鲁棒性毒化攻击

ai2-olmo-eval开源项目 – 评估语言模型性能的工具

ai2-olmo-eval开源项目 – 评估语言模型性能的工具

ai2-olmo-eval 是一个评估套件，旨在为语言模型在自然语言处理任务上运行评估管道，提供多种评估指标和详细报告，支持扩展和自定义评估。

NLP任务评估自定义评估评估报告语言模型评估工具

Residual Prompt Tuning开源项目 – 通过残差重参数化提升提示调优性能

Residual Prompt Tuning开源项目 – 通过残差重参数化提升提示调优性能

Residual Prompt Tuning是一种通过残差重参数化方法来改善提示调优性能的技术，旨在提高自然语言处理任务中的效果，优化预训练语言模型的表现。

提升提示调优性能残差重参数化自然语言处理优化预训练语言模型

StructuredRAG开源项目 – 评估大型语言模型的响应格式能力

StructuredRAG开源项目 – 评估大型语言模型的响应格式能力

StructuredRAG是一个用于评估大型语言模型（LLM）遵循响应格式指令能力的六个任务基准，旨在研究不同提示策略对模型性能的影响，并提供复杂任务的性能评估。该项目还包括开源实验代码和结果，方便研究人员进行进一步探索。

复杂任务性能评估开源实验代码提示策略研究评估大型语言模型

ConsoleX LLM playground官网 – 统一的LLM实验平台

ConsoleX是一个综合性的LLM实验平台，结合了聊天接口、LLM API实验和批量评估，支持所有主流LLM，并提供比官方实验室更多的增强功能。

API接口探索LLM实验平台批量评估模型对话测试

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3