RIP（Rejecting Instruction Preferences）论文 – 提升指令微调数据质量的新方法

RIP是一种新型数据筛选方法，通过分析拒绝回复的质量、长度以及奖励差异来筛选指令提示，从而提升指令微调数据的质量和模型性能。该方法基于直接偏好优化（DPO）中的偏好对，能够筛选掉低质量的指令提示，并可以扩展为Self-RIP，用于生成高质量的合成指令数据。研究显示，RIP在Llama 3.1-8B和Llama 3.3-70B模型上显著提升了性能。

RIP（Rejecting Instruction Preferences）的特点:

1. 基于拒绝回复的质量和DPO中的奖励差异筛选指令提示
2. 分析拒绝回复的质量、长度以及偏好对中的奖励差异
3. 可扩展为Self-RIP，生成高质量的合成指令数据

RIP（Rejecting Instruction Preferences）的功能:

1. 过滤现有训练集，移除低质量数据
2. 创建新的合成数据集，适用于数据稀缺的场景
3. 在Llama 3.1-8B-Instruct和Llama 3.3-70B-Instruct模型上提升性能

相关导航

Improved Feature Distillation via Projector Ensemble开源项目 – 提升特征蒸馏方法的项目

该项目专注于通过投影器集成方法增强特征蒸馏技术，以提高模型性能和特征提取能力。

Teaching Arithmetic to Small Transformers开源项目 – 探索小型Transformer的算术学习

该研究调查了小型Transformer如何使用下一个token预测目标有效地学习算术运算和基本函数，包括加法、乘法、平方根等。

open-instruct开源项目 – 开源指令微调语言模型

open-instruct 是一个开源项目，专注于指令微调和后训练大型语言模型。它提供了最新的技术和指令数据集，支持直接偏好优化（DPO）和可验证奖励强化学习（RLVR），并在各种基准上评估模型性能。该项目为研究人员和开发者提供了一个平台，用于探索和改进指令微调技术。

BiPE开源项目 – 双层位置编码以改善长度外推

BiPE (Bilevel Positional Encoding) 旨在通过双层位置编码技术，提高模型在处理不同输入长度时的预测能力，尤其适用于序列建模任务。该项目通过增强位置编码的表达力，从而改善模型在长文本和变长输入上的性能。

hl-gauss-pytorch开源项目 – 基于PyTorch的高斯直方图损失函数

hl-gauss-pytorch是一个基于PyTorch实现的高斯直方图损失函数（HL-Gauss），为回归任务提供了全新的视角，能够有效提升模型的性能。

akg开源项目 – 深度学习网络算子优化器

AKG (Auto Kernel Generator) 是一个用于深度学习网络中的算子优化器，能够自动融合具有特定模式的算子，从而提升深度学习模型的性能。

功能调用和其他 API 更新官网 – 提升开发者体验和模型性能

OpenAI 在其 API 中推出了一系列新特性和改进，包括功能调用能力、新模型版本、更长的上下文、成本降低和旧模型弃用计划。这些更新旨在提升开发者体验和模型性能，特别是在处理外部系统交互、长文本分析和成本效益方面。

基于特征合成和空间一致性的无数据知识蒸馏用于图像分析官网 – 无数据知识蒸馏提升模型性能

本项目提出了一种新型的无数据知识蒸馏（DFKD）方法，通过结合特征合成和空间一致性来提升合成数据的质量并增强学生模型的性能。该方法生成多样且信息丰富的特征来指导学生模型，并使用空间一致性损失来鼓励学生模型在合成数据上产生空间一致的预测。这种方法允许在没有原始训练数据的情况下有效地从教师模型向学生模型转移知识，解决了隐私或存储限制的问题。

QA-LoRA开源项目 – 量化感知低秩适应的语言模型

QA-LoRA: 语言大模型的量化感知低秩适应。旨在量化和适应之间存在的不平衡自由度，通过组内操作符增加量化自由度，减少适应自由度，易于实施且性能显著提升。

Overthinking开源项目 – 评估大模型过度思考行为的系统框架

Overthinking 是一个系统评估框架，用于自动评估大语言模型中的过度思考行为。它通过分析模型是否过度依赖内部推理而非与环境互动，识别三种过度思考模式：'分析瘫痪'、'鲁莽行动'和'过早脱离'，并提供量化评分，帮助提升模型性能约30%。

One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation开源项目 – 跨架构知识蒸馏性能提升

该项目专注于在知识蒸馏中弥合不同架构之间的性能差距，通过有效的策略提升模型的表现。

Test-time Compute Scaling官网 – 动态计算策略提升模型性能

Hugging Face 实现并开源的推理阶段计算扩展研究，通过动态计算策略提升小型语言模型的性能。

LLaMA3-通过增加数据量显著提升模型性能

LLaMA3揭示了模型架构不变的情况下，通过增加数据量可以显著提升模型性能的现实。

DPO: Direct Preference Optimization官网 – 直接偏好优化语言模型

DPO（Direct Preference Optimization，直接偏好优化）是一种离线优化方法，直接利用偏好数据训练策略，无需显式奖励模型。该项目是基于论文《Direct Preference Optimization: Your Language Model is Secretly a Reward Model》的参考实现，支持因果 HuggingFace 模型和自定义数据集，提供了一种无需显式奖励模型的离线优化方法。特别适合语言模型对齐任务，研究表明其在控制生成情感、摘要质量和单轮对话响应上表现不亚于或优于现有方法。

直接偏好优化 (DPO)-改变 LLM 与人类反馈对齐的新算法

直接偏好优化 (DPO) 是一种新算法，旨在改变大语言模型（LLM）与人类反馈的对齐方式，提供强化学习的替代方案，从而提高模型对人类偏好的理解和响应能力。

暂无评论

暂无评论...