扩散模型推理资源

Awesome-Diffusion-Inference开源项目 – 扩散模型推理的精选资源

Awesome-Diffusion-Inference开源项目 – 扩散模型推理的精选资源

该项目汇集了精选的扩散模型推理论文，涵盖了多种技术，包括采样、缓存以及多GPU支持，为研究者和开发者提供了丰富的学习和应用资源。

代码示例多GPU支持扩散模型推理资源研究论文

ZhiLight开源项目 – 高性能LLM推理引擎

ZhiLight开源项目 – 高性能LLM推理引擎

由知乎和ModelBest公司开发的高性能LLM推理引擎，针对PCIe GPU优化，支持Llama等大模型变体。

PCIe GPU优化异步接口自定义张量量化模型

Kokoro-FastAPI开源项目 – 基于Docker的文本到语音模型部署

Kokoro-FastAPI开源项目 – 基于Docker的文本到语音模型部署

Kokoro-FastAPI 是一个基于 Docker 的 FastAPI 封装项目，专门用于部署 Kokoro-82M 文本到语音模型。它支持 CPU ONNX 和 NVIDIA GPU PyTorch 加速，提供自动分割和拼接功能，并支持多种语言和音频格式。该项目通过 Docker 实现便捷部署，适用于需要高效、多语言支持的语音合成场景。

Docker部署FastAPINVIDIA GPU加速ONNX推理

SparQ Attention-增强语言大模型效率的技术

是一种通过减少内存带宽需求来增强语言大模型效率的技术。它无需对预训练或微调进行更改，可以显著减少注意力内存需求，而不会影响准确性。

SparQ Attention内存带宽需求减少语言大模型运行效率优化

RetNet-LLM基础架构，兼顾性能和成本

提出 RetNet 作为 LLM 的基础架构，同时实现训练并行性、低成本推理和良好性能。

LLM基础架构RetNet低成本推理模型性能优化

工业界的推荐系统开源项目 – 讲解主流推荐技术与应用

工业界的推荐系统开源项目 – 讲解主流推荐技术与应用

结合小红书的业务场景和内部实践，深入讲解现代推荐系统的主要技术和算法，支持多种推荐策略，提供代码示例与实现细节，帮助用户理解和应用推荐系统的最佳实践。

代码示例小红书案例分析推荐策略推荐算法实现

LLM-Honesty-Survey开源项目 – 探讨 LLM 诚实性的研究资料

LLM-Honesty-Survey开源项目 – 探讨 LLM 诚实性的研究资料

探讨 LLM 诚实性的论文和研究资料列表，旨在深入了解 LLM 的自我认知和自我表达能力，并提出了改进这些能力的方法

LLM诚实性研究自我认知分析语言模型改进建议

ReasoningNLP开源项目 – 自然语言推理文献资源

ReasoningNLP开源项目 – 自然语言推理文献资源

ReasoningNLP是一个汇集自然语言推理相关文献的资源列表，包含大量论文、引用和链接，方便研究人员获取信息。

文献管理工具研究资源自然语言推理文献资源

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3