OpenSparseLLMs/Linearization开源项目 – 提升LLM计算效率的创新项目

OpenSparseLLMs/Linearization是一个将大型语言模型线性化为门控循环结构的创新项目，旨在通过线性化显著提升模型的计算效率。该项目提出了Liger框架，实现了LLMs的高效线性化，并提供了完整的训练与评估流程，助力模型优化。

OpenSparseLLMs/Linearization的特点:

1. 提出Liger框架，实现LLMs的高效线性化
2. 通过线性化显著提升模型的计算效率
3. 提供完整的训练与评估流程，助力模型优化

OpenSparseLLMs/Linearization的功能:

1. 用于大型语言模型的计算效率优化
2. 适用于模型训练与评估流程的优化
3. 支持门控循环结构的实现

相关导航

Sparse-Marlin开源项目 – 提升深度学习模型的计算和存储效率

Sparse-Marlin是一个优化工具，专为4bit量化权重的2:4稀疏性推理核设计，旨在提升深度学习模型的计算效率和存储效率，适用于各种深度学习应用。

VPTQ开源项目 – 极低比特的向量后训练量化

VPTQ是一种针对大型语言模型的极低比特向量后训练量化方法，旨在通过量化技术提高模型的计算效率和存储效率，同时保持模型性能。该项目适用于各种大型语言模型的优化，能够显著减少模型的内存占用和计算资源需求。

Predibase RFT官网 – 首个端到端强化微调平台

Predibase RFT 是由 Predibase 开发的强化微调平台，专注于通过强化学习优化大型语言模型（LLMs）。与传统监督式微调不同，RFT 不需要大量标注数据，而是通过奖励函数和自定义函数实现持续的强化学习。用户可以通过浏览器设置微调目标并上传数据，简化大型模型微调流程。平台支持课程学习、多 LoRA 框架和流式微批处理技术，提升训练和推理效率。此外，RFT 提供高性能无服务器部署解决方案，方便用户快速将训练好的模型部署到生产环境中。

Prompt Engineering Toolkit开源项目 – 优化大型语言模型提示的工具

辅助用户测试和优化大型语言模型(LLM)的提示工具，支持多模型测试、模板保存、动态生成提示、模型配置管理及并排比较输出结果，适用于开发者、研究人员和内容创作者。

所有路径通向似然：强化学习在微调中的价值论文 – RLHF在微调中的优越性研究

该项目探讨了强化学习（RL）在大型语言模型微调中的价值，特别关注基于人类反馈的强化学习（RLHF）为何通常优于离线偏好微调方法。论文提出了“生成-验证差距”假说，解释RLHF通过学习一个相对简单的奖励模型，并将策略搜索空间限制在对该奖励模型最优的策略子集，从而实现更好的性能。项目包括理论分析和实验验证，并提供了贝叶斯和频率学方法的替代方案。

Q-Filters开源 – 无需训练的KV缓存压缩方法

Q-Filters 是一种无需训练的 KV 缓存压缩方法，适用于大型语言模型。它利用查询和键向量的几何特性，通过上下文无关的简单投影高效压缩 KV 缓存，无需额外训练。该方法与 FlashAttention 兼容，在长上下文任务中表现出色，实验显示在高压缩比下仍能保持良好性能，例如在针挑草堆任务中达到 99% 准确率（压缩比 32 倍），并在文本生成中比 Streaming-LLM 减少高达 65% 的生成困惑度下降。

BOLT论文 – 增强LLM长链思考能力的框架

BOLT（Bootstrap Long Chain-of-Thought）是一个三阶段框架，旨在通过自举方法增强大型语言模型（LLMs）的长链思考（LongCoT）能力，无需依赖知识蒸馏或昂贵的人工标注。该框架允许LLMs分析问题、制定计划、反思并回溯，以解决复杂任务。BOLT在多样化基准测试中表现出通用性和鲁棒性，适用于信息搜索、创意写作、编码、规划和数学问题等领域。

2:4 Activation Sparsity Accelerating Transformer Inference and Training论文 – 加速Transformer训练和推理的稀疏性技术

该项目利用2:4稀疏性模式，通过硬件加速的GPU稀疏性来优化Transformer模型的训练和推理过程。特别针对Squared-ReLU激活函数，该函数天然具有高稀疏性（84-98%），在不损失准确性的情况下，前向和后向传播中的前馈网络（FFN）计算速度提高高达1.3倍。项目通过自定义内核高效处理稀疏操作，并通过张量分割和令牌排列优化后向传播，展示了稀疏性在加速大型语言模型（LLM）中的关键潜力。

TrucefulQA-提升LLM在数据集上的正确率

哈佛大学出品的新论文，旨在提升LLM在TrucefulQA数据集上的正确率。该项目通过改进模型的输出和修正机制，使得大型语言模型在处理特定数据集时表现更佳。

Lamini-Memory-Tuning开源项目 – 减少语言模型幻觉的创新技术

Lamini-Memory-Tuning是一项针对大型语言模型幻觉抑制的创新研究。通过重新思考泛化问题，该项目提出了基于记忆专家混合体的动态事实存储与检索机制，有效减少模型在处理大规模互联网数据时的幻觉现象。这一技术不仅提高了模型的准确性，还增强了其在复杂查询和对话系统中的表现。

mcts-llm开源项目 – 提升大型语言模型性能的轻量级项目

mcts-llm是一个集成了蒙特卡洛树搜索（MCTS）和提示工程技术的轻量级项目，旨在提高大型语言模型（LLMs）的性能。该项目通过结合MCTS算法与大型语言模型，优化提示工程，来提升模型的响应质量。其轻量级的设计使得该项目易于集成和使用，并且支持多种语言模型，适用于各种自然语言处理任务。

OpenManus-RL开源 – 强化学习优化LLM代理的开源框架

OpenManus-RL是由Ulab-UIUC和MetaGPT合作领导的开源项目，旨在通过强化学习（RL）优化大型语言模型（LLM）代理的推理和决策能力。项目支持多种推理模型（如Deepseek-R1、QwQ-32B）和训练框架（SFT/PPO/DPO），提供包含50,793条轨迹的多领域数据集（操作系统、电商等），并集成Tree-of-Thoughts等高级策略。项目动态更新研究成果，鼓励社区贡献。