上下文压缩

Context Compression for Auto-regressive Transformers with Sentinel Tokens开源项目 – 利用哨兵令牌压缩上下文

Context Compression for Auto-regressive Transformers with Sentinel Tokens开源项目 – 利用哨兵令牌压缩上下文

一种通过哨兵令牌压缩自回归变换器上下文的方法，提高模型效率。

上下文压缩哨兵令牌自回归变换器自然语言处理

Megatron-LLM开源项目 – 支持大规模分布式语言模型预训练和微调的库

Megatron-LLM开源项目 – 支持大规模分布式语言模型预训练和微调的库

Megatron-LLM是一个专为大规模分布式训练设计的库，旨在高效支持语言模型的预训练和微调。它提供灵活的模型架构配置，并支持多种优化算法，使得用户可以根据需求进行优化和扩展，同时易于与其他深度学习框架集成。

大规模分布式训练微调深度学习框架集成语言模型预训练

llm开源项目 – 在CPU上高效运行大型语言模型

llm开源项目 – 在CPU上高效运行大型语言模型

该项目旨在使用Rust语言在CPU上运行大型语言模型的推理。它不仅实现了快速的推理速度，还能在低能耗的情况下提供高效的性能。适用于本地推理和Rust项目集成，适合研究新语言模型应用。

CPU高效推理GGML格式支持Rust语言模型推理低能耗AI模型

ULLME开源项目 – 统一框架，优化语言模型

ULLME开源项目 – 统一框架，优化语言模型

ULLME是一个统一的框架，旨在通过生成增强学习优化大型语言模型的嵌入，支持双向注意力机制以及多种微调策略，帮助提升模型的性能和效果。

双向注意力机制大型语言模型优化微调策略生成增强学习

动手实现LLM中文版开源项目 – 从零开始构建自己的大型语言模型

动手实现LLM中文版开源项目 – 从零开始构建自己的大型语言模型

从零开始构建自己的大型语言模型，提供详细教程和代码实现，覆盖编码、预训练和微调过程，适用于对自然语言处理和人工智能领域感兴趣的开发者和研究者

LLM实现从零开始构建大型语言模型模型微调自然语言处理教程

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3