Efficient Large LM Trainer 是一款专为大规模语言模型设计的高效训练工具,旨在通过优化的算法和资源管理,提升训练速度并减少内存占用,支持多种硬件设备,便于用户集成和使用。
Epoching-Blog是一个集成了PyTorch、fastai和HuggingFace的自然语言处理实战教程,旨在帮助用户通过实践深入理解深度学习及其在NLP领域的应用。项目提供了丰富的代码示例和详细的教程,适合希望提升NLP技能的学习者。
Gogosseract,一个通过 Wazero 实现的无 CGo Tesseract OCR 的 Go Lib。它提供高效的光学字符识别功能,支持多种语言,易于集成到各种 Go 应用程序中。
Torch Bridge是一个基于Pytorch Autograd的项目,用于优化桥梁桁架设计。它利用自动微分技术,提高设计效率,并提供灵活的框架,以便于创建和调整复杂的桁架结构,同时能够处理各种结构约束和目标。
slowllama实现了在苹果M1/M2设备(如MacBook Air或Mac mini)上对Llama2和CodeLlama模型(包括7B/70B等规模)进行微调,且未采用量化优化。
NLPretext是一个综合性的NLP文本预处理库,提供多种文本处理功能,旨在为各种NLP用例提供高效和灵活的解决方案。它支持大规模文本数据的高效处理,并且允许用户根据需求定制预处理选项,方便集成和使用。
Speech To Code项目让你通过口述来编写代码,结合语音识别和自然语言处理技术,能够将复杂的自然语言指令转换为多种编程语言的代码,理解上下文生成准确的代码。
这是一个轻量级的Transformers.js封装,用于将其API代理到Pyodide环境中,使得Python可以无缝调用JavaScript中的机器学习模型。
LlamaIndex(原名GPT Index)是一个开源工具,专注于将大型语言模型(LLMs)与外部数据源集成,帮助开发者构建更强大的问答系统和知识库应用。它提供了一种结构化的方式来管理LLM的数据,支持多种数据源和索引策略,旨在提升LLM应用的开发效率和数据检索性能。
Flappy Monorepo 是一个面向开发者的生产级 LLM 代理 SDK,旨在简化 AI 的集成和使用。它支持多种大语言模型,确保稳定性,并提供易于扩展和定制的功能,适合各种应用场景。
Transformers Notebooks是一组用于自然语言处理的Jupyter笔记本,旨在帮助用户快速上手使用Transformers库,提供丰富的示例和教程,涵盖文本分类、问答、翻译等多种任务,同时支持快速实验和模型评估。
这是一个新的模型,超越其他模型在代理能力基准测试中表现出色,尤其在语言和编码任务上表现优异。
8个关于在多GPU上训练大型语言模型(或任意神经网络)的挑战性难题,旨在让读者亲身体验关键基本原理,并理解内存效率和计算流水线的目标。
LiteChain是一个构建LLMs应用的轻量级替代LangChain的选择,专注于拥有小而简单的核心,易于学习、适应,文档完备,完全类型化和可组合,旨在帮助开发者快速实现复杂应用逻辑。
用Rust语言开发的语言模型管控框架,其设计目标是提供一个简单易用且易扩展的管控框架,帮助开发者创建语言模型管控应用。
这是复旦大学王一老师开源的一个高效GPT实现,经过2.5年的努力,旨在单个GPU上成熟且高度优化。
OpenLM是一个与OpenAI兼容的库,可以调用其他供应商(如HuggingFace,Cohere等)的LLM。它的使用方式与OpenAI的Completion API相似,返回的响应结构也相似。
TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务。
quantkit是一个命令行工具,专门用于下载和转换HuggingFace模型,支持多种模型格式的量化,旨在简化模型处理流程。
开源代码解释器,利用多个 HuggingFace 模型的强大功能,将指令转换为可执行代码,可以执行多种任务。
llama4micro是一个在单片机上运行的LLaMA模型,专为资源受限的环境设计,支持15M参数模型,内存占用约60MB,能够以每秒约2.5个token的速度生成文本,特别适合生成小故事,优化用于单片机平台。
用于微调和评估开源大型语言模型的工具集,目前处于早期开发阶段,旨在为研究人员和开发者提供一个强大、灵活且易于使用的解决方案。
Codium AI pr-agent是一款开源工具,旨在帮助开发者更快、更高效地审核 PR。它会自动分析 PR,提供反馈和建议,并可以回答文本的提问。
WinkNLP是一个自然语言处理库,提供高性能的分词和多种NLP功能,适用于JavaScript应用程序。
Cursive是一个直观的Python大型语言模型(LLM)框架,旨在简化与LLM的交互,支持多种模型和任务,提供高效的数据处理能力和灵活的API设计,适用于各种应用场景。
一个智能化的命令行助手工具,专为系统管理员设计,可帮助解决Shell脚本相关问题。支持Bash命令和脚本、系统管理任务、Git操作、文件管理、进程处理等功能。可在tmux会话中运行,支持管道输入和特定面板上下文选择,极大提升了命令行工作效率。
Ratchet是一个跨平台的浏览器机器学习框架,支持多种机器学习模型,兼容各种浏览器,易于集成到现有的Web应用中,提供高性能的计算能力,并且设计了用户友好的API,方便开发者使用。
TrustCall 工具:基于 LangGraph 的强大工具调用库,旨在通过让 LLM(大型语言模型)生成 JSON 补丁操作来提高生成和修改复杂 JSON 结构的效率和准确性
该项目演示了如何使用HuggingFace和DeepSpeed对EleutherAI的GPT-Neo模型进行微调,以生成Netflix电影描述,整个过程仅需47行代码,便于实现高效的文本生成。
Chocolate Factory 是一款开源的 LLM 应用引擎/应用框架,旨在帮助您轻松打造强大的 SDLC + LLM 生成助手,同时集成代码库 AI 助手功能,支持多种设计思想,基于 Apache 2.0 协议进行开发。