Llama 2 Everywhere (L2E) 是一个友好的llama2.c的分支,旨在使Llama 2 LLM架构能够在各种设备上兼容运行,从Chromebook到企业高密度单核部署。该项目提供了多种构建目标,利用不同的库和工具来提高性能和可移植性,确保用户能够在不同的环境中高效使用Llama 2。
Functime是一个用于大规模数据集时间序列机器学习的Python库,支持高效的数据处理和多种预测算法,帮助用户进行灵活的模型选择和评估。
Grok-1是xAI推出的开源大语言模型,拥有3140亿参数,适用于NLP任务,并提供JAX示例代码,便于加载、运行和微调。
一系列开放的方法,可帮助成功训练大型语言模型和多模态模型,包含丰富的脚本和技术材料,基于作者的实践经验,并提供持续更新的知识库。
Phi2-mini-Chinese 是一个从零开始训练自己的Phi2中文小模型的项目,支持加载本地知识库进行检索增强生成(RAG),旨在提供强大的中文对话能力和灵活的训练选项。
一个闭环框架,让LLM可以通过程序的形式,制作并使用全新的工具(能重复使用的那种)。
Arcade AI是一个Python SDK和CLI工具包,专注于提升LLM应用和智能代理的能力。它提供多种预构建工具包,支持GitHub、Gmail、Slack等服务的集成,简化了开发者在构建AI应用时连接用户数据和服务的复杂性。此外,Arcade AI支持OpenAI、Anthropic等多种语言模型,并具备OAuth认证和自定义工具开发功能。
Unsloth 是一个用于训练和推理大型语言模型(LLM)的工具,特别适用于使用 DeepSeek 的 GRPO 算法进行训练。它显著减少了 VRAM 的使用,使得在有限资源下训练 LLM 更加高效。Unsloth 支持多种主流架构优化,如 Llama3、Qwen 等,在消费级显卡上实现 2-5 倍训练速度提升,显存占用降低 70%。此外,Unsloth 还支持本地 QLoRA 微调,适用于多种自然语言处理任务,并提供了适合初学者的 Colab 环境,方便用户快速上手。
蚂蚁集团开源的测试行业大模型工具,主要包含测试领域模型TestGPT-7B模型及其配套工具。
一个机器学习算法的实现项目,专注于使用numpy库从零开始构建神经网络和Transformer模型,旨在帮助理解和学习机器学习的核心概念
Fleet Context是一个命令行工具,支持1218个Python库的问答和代码生成,基于GPT-4及其他OpenAI模型。
JupyterLab的智能语音助理扩展,基于Whisper-1和GPT-3 API,能够交互式生成代码并提供辅助,从而提高编程效率和用户体验。
Azure OpenAI服务代理,将OpenAI官方API请求转换为Azure OpenAI API请求,支持GPT-4,简化了与Azure OpenAI服务的集成,并提供统一的API接口,方便开发者使用Azure的强大能力。
ark-nlp是一个旨在收集和复现学术与工作中常用的自然语言处理模型的平台,支持多种NLP任务,并提供丰富的预训练模型,适合研究人员和开发者使用。
AgentLLM是一个基于开源大语言模型的自主智能体项目,旨在证明嵌入式LLM能够以可接受的性能处理复杂的目标导向任务,且完全在浏览器中运行。
sktime 是 Python 中用于时间序列分析的库。它为多个时间序列学习任务提供了一个统一的界面,包括时间序列分类、回归、聚类、注释和预测。
该项目是Azure OpenAI服务的示例代码库,旨在补充OpenAI的食谱,展示如何使用Azure OpenAI服务,涵盖多种使用场景,如文本生成和对话系统,提供易于理解的文档和示例,支持多种编程语言和框架。
XAgent是一个开源实验性大型语言模型驱动的自主Agent,可以自动解决各种任务,旨在成为一种通用的工具,适用于多种复杂任务场景。它基于大型语言模型,提供智能决策支持,帮助用户提升工作效率,同时允许开发者进行自定义和扩展。
SmartExcel.cc是一个使用人工智能生成所需Excel公式的工具,利用ChatGPT API和Vercel AI SDK进行实时交互,通过Vercel Edge Function将请求发送到ChatGPT API,并将响应流式传输回应用界面,提升用户体验。
一个新的LLM训练方法,通过将训练分散到不同的边缘设备上以保持数据隐私,同时最大化利用边缘设备的算力。
Cerebellum 是一个基于智能体的浏览器自动化工具,通过使用 LLM 构建的智能体,实现自动化操作键盘和鼠标,在网页上完成数据抓取、自动化测试等任务。该工具兼容任何 Selenium 的浏览器,并支持 Cluade 3.5 Sonnet 模型,旨在提高网页操作的效率和准确性。
nlp-uncertainty-zoo是一个专注于自然语言处理中的不确定性量化方法的模型库,基于PyTorch实现,提供多种不确定性量化工具,支持多种NLP任务,具有良好的可扩展性。
Semantic Kernel 是一个轻量级的开源框架,通过 Semantic Kernel 您可以快速使用不同编程语言(C#/Python/Java)结合 LLMs(OpenAI、Azure OpenAI、Hugging Face 等模型)构建智能应用。
xCodeEval是一个大规模多语言多任务基准,用于评估代码理解、生成、翻译和检索的能力,旨在为研究和开发提供支持。
LLM-zero2hero是一个高度解耦的微调项目,旨在支持大语言模型的自定义训练、验证和推理过程。它提供了全量微调和LoRA微调的能力,使用户能够灵活地调整模型以满足特定需求。
Remembrall是一个API平台,旨在为基于LLM的应用提供长期记忆能力。开发者只需两行代码即可将上下文信息插入到LLM调用中,使得LLM能够利用用户的聊天记录和相关文档进行更智能的回应。
Shortest是一个端到端的AI测试框架,利用Claude模型能力,通过自然语言编写可执行的单元测试,支持GitHub与2FA集成,提供安全认证方式。
Llama 2 模型的优化版本,包含一系列解码器层,使用不同的投影大小和架构变化以提高效率。
通过实现环境配置功能以及整合多项优化训练技术,使得用户能以简单高效的方式对语言模型进行训练优化,得到切实可行的产出
ToolBench是一个强大的工具,支持超过16000个真实世界的API,旨在帮助开发者轻松集成和使用API,提供丰富的文档和示例,并支持多种编程语言的调用。