性能优化

awesomeMLSys开源项目 – 精选机器学习系统资料集合

awesomeMLSys开源项目 – 精选机器学习系统资料集合

分享一份精选机器学习系统的入门资料集合，收集了一系列有关注意力机制、性能优化、量化、长上下文长度和稀疏性等方面的论文、视频和代码库。

代码库性能优化机器学习资料集合注意力机制

LETSQL开源项目 – 延迟计算系统，优化AI管道预处理

LETSQL开源项目 – 延迟计算系统，优化AI管道预处理

LETSQL专注于人工智能管道预处理的延迟计算系统，通过跨引擎缓存和静态规划来优化性能，支持从研究到生产环境的无缝过渡，并提供便携式用户自定义函数。

AI管道预处理延迟计算系统性能优化数据工作流

O1 ML Scientist Automation System开源项目 – 自动化机器学习系统

O1 ML Scientist Automation System开源项目 – 自动化机器学习系统

这是一个自动化机器学习系统，利用O1和Claude AI模型迭代开发、改进和优化机器学习解决方案，在Kaggle Spaceship Titanic挑战中实现了前1%的性能。

Claude AI模型Kaggle挑战O1 ML Scientist性能优化

Drive Like A Human开源项目 – 重新定义自动驾驶的智能交互

Drive Like A Human开源项目 – 重新定义自动驾驶的智能交互

用大型语言模型重新思考自动驾驶，使用GPT-3.5作为默认的大型语言模型(LLM)，介绍了LLM在驾驶场景中的闭环交互能力以及通过记忆能提升性能的方法

大型语言模型性能优化自动驾驶驾驶场景交互

GPT Core开源项目 – 快速创建和训练大型语言模型

GPT Core开源项目 – 快速创建和训练大型语言模型

GPT Core用于创建和训练先进的大型语言模型(LLM)，着重强调了其快速性能，可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失。

快速训练大型语言模型性能优化模块化代码自定义LLM创建

SD4J (Stable Diffusion in Java)开源项目 – Java中的稳定扩散推理工具

SD4J (Stable Diffusion in Java)开源项目 – Java中的稳定扩散推理工具

基于ONNX Runtime的Java的Stable Deffusion管线，具有GUI界面和负面文本支持，展示了如何在Java中使用ONNX Runtime进行推理，并提供了性能优化的最佳实践

GUI图像生成Java中的稳定扩散推理工具ONNX Runtime性能优化

awesome-low-level-design开源项目 – 学习低级设计的资料集合

awesome-low-level-design开源项目 – 学习低级设计的资料集合

一个关于学习低级设计（LLD）的资料集合，涵盖了基础的面向对象编程（OOP）概念、设计模式、UML 图、面试题目以及相关书籍推荐等内容。

UML图学习低级设计性能优化数据库设计

LightLLM开源项目 – 轻量级的LLM推理与服务框架

LightLLM开源项目 – 轻量级的LLM推理与服务框架

LightLLM是一个基于Python的LLM（大型语言模型）推理和服务框架，以其轻量级设计、易于扩展和高速性能而闻名。它利用FasterTransformer、TGI、vLLM和FlashAttention等开源实现的优势，提供比Vllm更快的表现。

性能优化模型推理模型服务轻量级LLM推理框架

Awesome Mojo开源项目 – Mojo语言资源汇总

Awesome Mojo开源项目 – Mojo语言资源汇总

Mojo语言相关资源列表，Mojo是一门新的编程语言，将Python的易用性与C++和Rust的性能结合在一起，同时允许用户利用Python库的庞大生态系统。

AI开发Mojo语言资源Python兼容性性能优化

LLMLingua开源项目 – 高效提示压缩工具

LLMLingua开源项目 – 高效提示压缩工具

LLMLingua是微软开发的提示压缩工具，利用经过良好训练的小型语言模型进行对齐，旨在实现提示的高效压缩和性能优化，最大程度上保持输出的质量和一致性。

API调用ChatGPT对话优化性能优化提示压缩工具

Firefly开源项目 – BEAM语言的新编译器和运行时

Firefly开源项目 – BEAM语言的新编译器和运行时

Firefly是一个新型的BEAM语言编译器和运行时，旨在提升编译和运行效率，提供更好的开发体验。它支持多种BEAM语言，具备高效的编译过程和优化的运行时性能，同时还提供实时错误检测和调试功能，方便开发者快速定位问题。

BEAM语言编译器Firefly实时错误检测开发工具

Logos Shift开源项目 – 替换昂贵的LLM API调用

Logos Shift开源项目 – 替换昂贵的LLM API调用

Logos Shift 提供一个简单的方式来替换昂贵的LLM API调用，自动采用经过定制后的更小更快的模型，有效提升模型调用效率并简化管理流程。

定制化模型性能优化替代LLM API调用模型管理

MonkeyPatch开源项目 – 构建可扩展的LLM应用

MonkeyPatch开源项目 – 构建可扩展的LLM应用

MonkeyPatch 是构建可扩展的 LLM 驱动应用的最简单方式，随着时间推移，应用的成本和速度不断优化。

LLM驱动应用可扩展性性能优化智能化支持

A.I Framewerks官网 – 强大的人工智能框架

A.I Framewerks是一个强大而全面的人工智能框架，旨在帮助开发者轻松创建和部署AI模型。它提供广泛的功能和工具，以加速开发过程并提高性能。

AI模型创建与部署开发工具性能优化数据分析与预测

OpenAI Usage Insights (ForDevelopers)官网 – 增强OpenAI使用监控的Chrome扩展

OpenAI Usage Insights是一款强大的Chrome扩展，能够提供对OpenAI使用情况的深入可视化。用户只需安装此扩展并授权访问其OpenAI账户，即可轻松监控和分析使用数据。

Chrome扩展OpenAI使用监控使用数据分析性能优化

Humy.ai官网 – 快速轻松创建个性化AI助手

Humy.ai是一个无需编写代码即可创建和部署训练有素的AI助手的产品。用户只需定义助手的行为，上传数据（如网页、常见问题、文档、文章），即可嵌入为聊天气泡或与通信渠道同步，从而获得洞察并优化性能。

互动常见问题解答性能优化教育辅导文档分析

Composable Prompts官网 – 快速构建和测试LLM任务的平台

Composable Prompts是一个顶尖平台，旨在快速构建、测试和部署基于大型语言模型（LLMs）的任务和API。它为LLMs的世界带来了组合、模板、测试、缓存和可视化等功能，使开发者能够高效地创建强大的提示，重用它们，并在不同环境中进行测试。同时，它通过智能缓存优化性能和成本，并允许轻松切换模型和运行环境。

API开发客户支持自动化快速构建LLM任务的平台性能优化

MetaGPT开源项目 – 多角色智能协作框架

MetaGPT开源项目 – 多角色智能协作框架

MetaGPT 是一个多智能体框架，能够扮演不同的角色，如工程师、产品经理、架构师和项目经理。它通过自动优化提示词、生成产品需求文档、设计文档、任务分配与管理、代码仓库生成等功能，协助用户完成复杂的任务。MetaGPT 还支持多角色协作，自动生成软件开发流程和标准操作程序（SOP），适用于各种项目管理和开发需求。

API接口可扩展性多AI智能体框架开放源代码

1 2

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3