AI编程工具 | 第 55 页

基于大规模生产工作流数据训练的智能网络Agent，可将开源大型语言模型微调为专门的网络Agent，帮助用户更高效地完成网络任务。它支持将大型语言模型微调以适应特定的网络任务，通过利用生产规模的工作流数据进行训练，显著提高用户在网络任务中的效率。ScribeAgent具有易于集成和扩展的架构，并欢迎社区的贡献。

0

内容生成与编辑大型语言模型微调搜索引擎优化智能客服助手

PyTorch-Tutorial-2nd开源项目 – 全面的PyTorch使用指南

PyTorch实用教程（第二版）：面向深度学习工程师的全面指南，覆盖从零基础到项目应用和工程化部署的各个阶段，旨在帮助读者轻松掌握PyTorch的使用

0

PyTorch使用指南工程化部署深度学习教程项目应用示例

heyCLI开源项目 – 自然语言与命令行交互的工具

heyCLI 是一个基于 GPT-3 davinci-003 的自然语言命令行工具，用户可以使用自然语言与命令行终端进行交互，简化命令行操作，提高使用便捷性。

0

GPT-3命令行交互命令行操作简化定制化命令执行自然语言命令行工具

Auto-Llama-cpp-支持本地运行llama模型的Auto开源项目 – GPT分支

在Auto-GPT基础上的一个分支，增加了对本地运行llama模型的支持，该项目主要是一个概念验证，速度较慢，但有时会得到很不错的结果。

0

Auto-GPT分支本地运行llama模型概念验证高质量结果生成

mnist-mlops-learning开源项目 – 机器学习数字识别部署实例

基于FastAPI、MLflow和Streamlit的数字识别模型的完整部署实例，提供高性能API、模型管理和交互式界面，支持模型的训练和预测。

0

FastAPIMLflowStreamlit交互式界面

LOMO-优化大型语言模型训练的工具

LOMO是一种新的优化器，旨在降低大型语言模型（LLM）训练的门槛，促进全参数微调在有限资源下的应用。它通过将梯度计算和参数更新融合在一个步骤中，显著降低了内存使用，最高可节省10.8%。这使得在资源有限的环境中也能进行大规模模型的训练。

0

LLM训练优化器全参数微调工具内存节省技术

pg-text-query开源项目 – 将自然语言转化为SQL查询

pg-text-query是由bit.io开发的项目，利用OpenAI的CodeX模型，将自然语言提示生成SQL查询，以便于用户更方便地进行数据库操作。

0

AI生成SQL查询工具数据库操作辅助工具自然语言转SQL查询

DeepSeek V3开源项目 – 高效开源AI模型，性能对标GPT-4

DeepSeek V3是由中国AI公司深度求索发布的一款高效开源AI模型，采用专家混组（MoE）架构，仅激活部分参数以减少算力需求，显著降低内存需求。模型规模达到671B参数，激活37B参数，推理成本低，性能接近甚至在某些领域超越GPT-4。在编程、数学等领域表现优异，支持多种部署方式，适用于自然语言处理、文档分析、对话系统等场景。

0

SOTA性能复杂数学问题解决多任务处理开源深度学习模型

llama2.mojo开源项目 – 高效的Llama 2推理实现

这是一个基于Mojo编写的Llama 2实现，旨在显著提升推理速度，充分利用Mojo语言的优势，支持Llama 2模型，并采用优化的内存管理，便于在各种环境中使用。

0

AI模型优化Llama 2推理实现Mojo语言性能提升

tiktoken开源项目 – OpenAI LLM 的开源 tokeniser

tiktoken 是一个用于处理文本的开源工具，专为 OpenAI 的大型语言模型（LLM）设计，能够高效地将文本转换为 token，并支持多种编码方式，兼容不同的 OpenAI 模型。它还提供了批量处理能力，便于用户进行大规模数据的处理和分析。

0

OpenAI LLM tokeniser批量数据处理文本处理工具自定义词汇表支持

Modded-NanoGPT-高效简化的GPT开源项目 – 2模型训练器

基于PyTorch的GPT-2模型训练器，优化效率和代码简化，实现现代技术如旋转嵌入，以更少的token达到相同验证损失。该项目专注于提升模型训练的效率，使得用户能够在多种深度学习任务中更便捷地使用GPT-2架构。

0

GPT-2模型训练器代码简化文本生成深度学习

catgrad开源项目 – 基于范畴论的深度学习编译器

catgrad是一个基于范畴论的深度学习编译器，它不使用autograd进行训练，而是将模型的反向传播编译为静态代码。这意味着训练循环可以在不需要深度学习框架的情况下运行，甚至不需要catgrad本身。该项目支持多个编译目标，包括Python/numpy和C++/GGML等，从而提供更高的灵活性和性能。

0

参数优化无框架训练深度学习编译器静态代码反向传播

CodeGeeX2开源项目 – 强大的多语言代码生成模型

CodeGeeX2 是基于 ChatGLM2 架构的第二代多语言代码生成模型，性能显著提升，仅需60亿参数即可超越150亿参数模型的性能。它支持多种编程语言的代码生成任务，广泛应用于代码补全、代码建议、代码翻译和跨语言代码转换等领域。

0

代码优化代码补全多语言代码生成模型编程教育

groq-appgen开源项目 – 手绘生成 App UI 的开源项目

groq-appgen 是一个基于 Groq 的开源项目，允许用户通过手绘 UI 生成应用界面，并通过语音交流进行优化，具备快速响应和分享功能。

0

LlamaGuard内容安全检查实时代码生成开源项目手绘生成App UI

O1 ML Scientist Automation System开源项目 – 自动化机器学习系统

这是一个自动化机器学习系统，利用O1和Claude AI模型迭代开发、改进和优化机器学习解决方案，在Kaggle Spaceship Titanic挑战中实现了前1%的性能。