使用C语言加速的语言模型推理项目,旨在实现单个GPU单批次的硬件利用最大化,具有最小的实现和依赖。该项目通过高效的算法和实现方式,优化了GPU的性能,适合多种语言模型的应用场景。
LogitsProcessors Zoo是NVIDIA开发的一款工具集,旨在为大语言模型(LLM)提供输出控制功能。通过一系列处理器,用户可以自定义和增强模型的行为,以满足特定需求。该工具集支持多种主流框架,如transformers、vLLM和TensorRT-LLM,能够帮助开发者优化模型的生成策略和内容多样性。
混合自回归线性核(Mixed Auto-Regressive Linear kernel),一个经过高度优化的FP16xINT4矩阵乘法核,用于LLM推理,可以在批量大小为16-32个token的情况下实现接近理想的约4倍加速。
FLUXSwift是FLUX.1模型的Swift实现,利用mlx-swift库在苹果硅芯片上进行GPU加速,旨在高效生成图像。
MuJoCo Playground是一个开源库,提供GPU加速的机器人学习环境,支持模拟到现实的转换,适用于多种控制任务和环境。它包括经典的控制环境,并支持四足和两足动物的行走模拟,以及非抓握和机械手的操作,此外还提供基于视觉的支持。
对当今大型语言模型 (LLM) 背后细节的低代码介绍,通过完全在 Excel 中实现的真实LLM了解 AI 的工作原理。
该项目提供了Vision Transformer在Tensorflow中的完整实现,支持多种数据集和任务,易于扩展和修改,并包含详细的使用示例和文档,帮助用户快速上手并深入了解模型的应用与性能。
一个全面的列表,包含与基于基础模型(如LLM和VLM)相关的决策制定的论文、代码库和数据集。
GPT-Instagram是一个基于GPT技术的自主多智能体AI应用,使用Next.js、LangChain.js和LangGraph.js来研究并推荐反映用户个性的Instagram病毒式帖子。该项目通过多智能体技术提升内容推荐的准确性,并能够基于用户输入和偏好进行智能分析,以生成符合用户个性的高质量内容。
EmbedJs是一个基于Node.js的RAG框架,旨在简化与大型语言模型(LLM)和嵌入工作的流程,支持个性化的LLM响应,使得开发者能够更高效地构建智能应用。
Haystack是一个开源的搜索框架,旨在帮助开发者构建高效的问答系统和搜索引擎,特别适用于自然语言理解(NLU)和信息检索(IR)任务。它支持从文档、数据库、API等多源数据构建智能问答系统,并已在金融合规审查中实现90%的准确率。Haystack具有高度可定制的管道设计,能够处理和检索大规模文档集,适用于企业知识库、法律合同、医疗报告等多种场景。
用Python字典构建复杂LLM应用的框架,简单直观,让你轻松打造自己的LLM应用。它支持构建复杂的代理系统,适用于生产环境,并且具有高灵活性和易于定制的特点。
Magi是一个基于JAX的强化学习库,支持多种算法并提供灵活的环境接口,易于扩展和自定义,集成了评估和可视化工具。
这是一个正在开发中的SQLite扩展,旨在使用llama.cpp生成文本嵌入,适用于文本语义搜索和分析。
赤兔量化注意力:专注于量化注意力机制的高效 GPU 实现库,旨在加速长序列数据的处理速度,并且与 Long-Context-Attention 库无缝集成
assistant-ui是一个专为构建AI对话交互而设计的React组件库,提供预配置项目以便快速启动,并集成了OpenAI API,用户可以通过多种聊天界面示例轻松实现聊天功能。
AI Dev Gallery是一个开源项目,旨在帮助Windows开发者学习如何将本地模型和API集成到Windows应用中,提供丰富的示例和文档支持。
OpenDevin 是一个开源的自主 AI 软件工程师平台,旨在通过 AI 和大语言模型(LLMs)来简化软件开发过程。它支持从需求分析、代码编写、测试与调试到部署的全流程自动化开发,能够处理多种编程语言,并与人类开发人员协作完成复杂的软件工程任务。
Twitter的推荐算法代码,旨在提供个性化的用户体验并推送有吸引力的内容。该算法通过分析用户与推文的互动、推文内容、社交图谱信息等,灵活地调整推荐策略,致力于提升用户的参与度和满意度。
Bolt.new-any-llm是一款支持在浏览器中使用多种大型语言模型(LLM)进行全栈Web应用开发、编辑和部署的工具。它不仅满足本地化老板的需求,还简化了网站项目的开发流程,使产品经理能够作为整个研发团队的核心。
Dynamiq是一个专为Agentic AI和大型语言模型应用设计的AI智能协同框架,旨在简化AI应用的开发过程,擅长协调检索增强型生成与大型语言模型代理,同时支持多种AI技术的集成,提供高效的任务调度和资源管理。
一个开放的Web应用规范和SDK,专为人类和AI协作设计的应用框架,支持使用标准Web技术(HTML/CSS/JS等)构建,具有AI原生协议、富界面支持、本地优先和组件可组合等特性,让AI能够更好地理解和操作应用
ZerePy 是一个开源的 Python 框架,旨在帮助开发者快速部署基于 OpenAI、Anthropic 或 EternalAI 的大型语言模型(LLM)AI 代理。它提供了一种灵活且易于扩展的架构,适合各种应用场景,并支持与其他应用的无缝集成,方便开发者进行定制和扩展。
一个面向大语言模型的工具和数据源访问协议服务器集合。提供多种预置服务器实现,包括文件系统、GitHub、Google Drive、PostgreSQL等集成,让LLM能够以安全可控的方式访问各类外部资源。支持TypeScript和Python两种SDK开发。
Unsloth Zoo是一个提供用于Unsloth的实用工具库,旨在支持免费微调和加速大型语言模型,帮助开发者更高效地使用和优化语言模型。
UltraEval-Audio是一个评估音频大模型的工具,类似于给智能语音助手打分,能够快速、方便地测试其表现,旨在帮助开发者优化和提升语音相关应用的质量。
《TensorFlow in Action》教你使用TensorFlow 2构建、训练和部署深度学习模型,涵盖从DL基础知识到NLP、图像处理和MLOps的高级应用。
Dify转OpenAI接口:将Dify API转换为OpenAI API格式的工具,使您能够在喜欢的OpenAI客户端中访问Dify的LLM、知识库、工具和工作流
大模型多智能体框架。核心提供了多智能体协作编排组件,其相当于一个模式工厂,允许开发者对多智能体协作模式进行开发定制,同时附带了搭建单一智能体的全部关键组件。
一个精选的ROS项目集合,收录了利用基础模型的机器人项目资源,包括框架、模型封装、开发工具和演示项目。涵盖了语言模型、视觉模型等在ROS环境下的应用,方便开发者快速找到和使用各类基础模型