动态稀疏注意力机制

MInference开源项目 – 长上下文LLM推理加速工具

MInference开源项目 – 长上下文LLM推理加速工具

MInference是一种高效的长上下文大型语言模型（LLM）推理加速工具，采用动态稀疏注意力机制和稀疏计算方法，显著加速长序列处理的预填充过程。它能够在保持高准确性的同时，将LLM处理百万上下文的时间提速10倍，适用于A100等硬件平台。MInference可直接应用于现有的LLM，无需预训练或额外微调，已在多个基准模型上验证其性能。

A100硬件支持动态稀疏注意力机制长上下文模型加速高效推理工具

ModelBox开源项目 – 高效AI推理应用开发框架

ModelBox开源项目 – 高效AI推理应用开发框架

适用于端边云场景的AI推理应用开发框架，提供了基于Pipeline的并行执行流程，能帮助AI应用开发者较快的开发出高效、高性能，以及支持软硬协同优化的AI应用。

AI推理应用开发框架Pipeline并行执行流程软硬协同优化高性能AI应用

DoubleSparse开源项目 – 高效加速大语言模型推理

DoubleSparse开源项目 – 高效加速大语言模型推理

一种高效加速大语言模型推理的技术，通过减少内存访问，几乎不损失性能，让模型运行更快更省资源

内存优化资源节省高效加速大语言模型推理

LookaheadDecoding开源项目 – 创新的并行解码算法

LookaheadDecoding开源项目 – 创新的并行解码算法

Lookahead decoding是一种创新的并行解码算法，加速大LLM的推理过程，提升模型生成文本的速度，适用于需要快速回应的应用。

HuggingFace兼容加速推理过程在线聊天机器人并行解码算法

imandra.ai官网 – 赋能AI的逻辑推理平台

Imandra是一个推理即服务的平台，赋予AI逻辑推理能力，适用于构建大型语言模型的思维模型、正式验证论证和结果，以及可审计的逻辑推理。

AI推理服务可审计推理报告大型语言模型形式验证

Tree of Thoughts开源项目 – 增强模型推理的强大算法

Tree of Thoughts开源项目 – 增强模型推理的强大算法

Tree of Thoughts (ToT) 是一个强大而灵活的算法，能将模型推理能力提升多达70%。该插件式版本允许用户连接自己的模型，体验超智能的推理能力。

Tree of Thoughts决策支持插件式架构智能应用程序

llama2.c开源项目 – 用纯C语言实现Llama 2模型推断

llama2.c开源项目 – 用纯C语言实现Llama 2模型推断

一个通过PyTorch从头开始训练Llama 2 LLM架构模型的项目，支持将权重保存到原始二进制文件并在简单的C文件中推断模型。

C语言实现Llama 2模型推断PyTorch训练参数调优

Flash Bi-directional Linear Attention开源项目 – 高效的双向线性注意力实现

Flash Bi-directional Linear Attention开源项目 – 高效的双向线性注意力实现

一个用于非因果建模的双向线性注意力实现项目，通过Triton优化模型性能，特别适合需要高效处理大量数据的AI应用

Triton优化双向线性注意力深度学习框架自然语言处理

Griffin-创新的门控线性RNN模型

Griffin是一种将门控线性RNN与局部注意力混合在一起的新模型架构，表现优于以往模型，能够处理长上下文并扩展到14B参数。该模型在训练数据量减少的情况下，仍能保持优异的表现，显著改善预测能力，并保留了Transformer架构在合成任务上的许多优点。

AI应用机器学习基础架构自然语言处理长上下文学习

OpenLibm开源项目 – 高质量的独立数学库

OpenLibm开源项目 – 高质量的独立数学库

OpenLibm是一个旨在提供高质量、可移植、独立的C语言数学库（libm），其质量超过Android源代码中的fdlibm。

C语言数学库数值计算科学计算高质量数学库

Sample tesing官网 – 自动获取预览环境，便于测试

Sample Testing项目可以为每个Git分支自动生成多个预览环境，灵活配置独立的资源和端点，适用于生产、质量保证或单纯的测试和处理。

Git分支测试快速验证代码更改自动生成预览环境

rs开源项目 – 基于JAX的随机搜索算法

rs开源项目 – 基于JAX的随机搜索算法

rs是一个基于JAX的随机搜索实现，专为运动任务设计，能够高效地利用MuJoCo XLA (MJX)进行训练，支持多种运动环境，便于研究和实验。

JAX随机搜索算法MuJoCo强化学习运动任务优化

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3