一个开源项目,主要探讨和学习人工智能、深度学习的计算机系统设计,围绕着在华为昇腾工作中积累和构建的AI系统全栈内容。
LLaVA C++ Server 是一个用于LLaVA模型的高效推理的API服务器,旨在提供简单易用的接口,兼容多种平台与环境,支持模型的动态加载与卸载,并优化内存管理和性能。
gptme是一款可以在本地终端运行的个人AI助手,能够编写代码、使用终端、浏览网页和查看图像。支持多种操作和主流LLM提供商。
TaiChi是一个开源库,专注于少样本学习,可以支持多种自然语言处理任务,具有灵活的API设计和强大的可扩展性,适合研究者和开发者使用。
DocsGPT是一个开源文档助手,旨在帮助用户生成、提取和管理各种编程语言的文档。它支持多种文档格式,并提供智能搜索功能,用户可以轻松地找到相关信息。其用户友好的界面使得文档处理变得简单高效。
Azure Open AI demos是一系列详细的Azure开放AI技术演示,汇集了开放AI生态环的众多功能组件,通过实用案例帮助开发者高效开发AI应用。
利用AI协助软件设计和开发的工具,通过与用户的交互对话逐步捕获设计规范,而不是依赖单一提示,用户可以在命令行界面或Streamlit应用程序中使用它。
OneDiff是一个用于加速扩散模型的工具,提供了一种新的免训练、几乎无损的范式,显著提升模型的迭代速度。
《人体运动扩散模型》的论文代码,旨在高效生成和编辑人体运动,支持多种运动风格和动作捕捉数据。
该项目旨在通过可扩展的对数行列式计算来增强高斯过程核学习的效率,适用于大规模数据分析和预测。
MonkeyPatch 是构建可扩展的 LLM 驱动应用的最简单方式,随着时间推移,应用的成本和速度不断优化。
Inferflow是一个高效且高度可配置的大型语言模型推理引擎,旨在优化推理性能,支持多种自定义配置,以满足特定需求。
该研究开发了一种简化的自我训练方法,称为ReST^EM,该方法使用期望最大化(expectation maximization)来微调语言大模型(LLM),表现优于仅依赖人类数据进行微调的策略。
MLX Engine是一个开源项目,旨在利用Apple M系列芯片的硬件加速能力,以超快的速度和100%本地、离线的方式运行大型语言模型(LLM)。它能够在M3芯片上以约250 tok/秒的速度运行Llama 3.2 1B模型,始终以结构化JSON格式输出,支持通过代码或Chat UI与模型进行交互,并能同时运行多个模型,用户还可以从Hugging Face下载任何模型。
ComfyUI-3D-Pack是一个先进的3D输入处理套件,使用尖端算法(如3DGS、NeRF等)和模型(InstantMesh、CRM、TripoSR等)生成高质量的3D资产,使3D内容的生成像图像和视频一样便捷。
Loopquest 是一款专为具身智能体设计的生产工具,提供可视化界面,支持多种机器学习算法,并集成实时数据分析与监控功能,能够在多种硬件平台上运行,灵活的插件系统使其功能可扩展。
SWE-Agent 是一款开源软件工程代理,旨在通过与通用语言模型(如 GPT-4)结合,提供软件工程任务的解决方案。它能够自动修复 GitHub 仓库中的 bug 和 issue,支持多种编程语言,并与现有的开发工具和环境集成。在 SWE-Bench 上,SWE-Agent 解决了 12.29% 的问题,达到了当前最先进的性能水平。
Aviary是一个基于Gymnasium框架的语言模型Agent训练平台,专注于构建性任务,提供了灵活的训练环境和多种模型集成,旨在满足研究和应用中的多样化需求。
最全面的深度强化学习算法PyTorch实现合集,整合了13种主流强化学习算法,适合各级别研究者和开发者。每个算法都配有详细文档、完整训练曲线和论文引用,提供丰富的学习资源推荐,包括环境配置、经典书籍、在线课程和重要论文,确保用户能够顺利进行深度强化学习的实验和研究。
一个用C++/CUDA实现的大型语言模型(LLM)推理工具,不依赖额外的库,除了用于输入输出。该工具旨在提供高效的推理能力,支持加载和保存冻结的LLM权重,适合各种应用场景。
利用大型语言模型(LLM)驱动的NPC(非玩家角色)项目,旨在为游戏开发提供高性能的交互式角色,支持多种游戏场景,能够在本地硬件上运行,为开发者提供灵活的API接口,增强游戏的互动体验。
JARVIS是一个框架,利用像ChatGPT这样的语言模型,连接机器学习社区中的各种AI模型,从而解决复杂的AI任务。
Hugging Face关于如何构建AI Agent的课程,介绍了AI Agent的概念、构建高效Agent的关键组件、以及通过smolagents库实现这些代理的方法。课程内容丰富,适合想要深入了解AI Agent的学习者。
一个用于快速构建AI驱动界面的React组件库,基于RICH交互范式设计,提供原子化组件和完整的模型集成方案,支持对话流管理、主题定制,让开发者能轻松搭建企业级AI交互界面。蚂蚁开源的构建 AI web应用的框架,覆盖了多种常用的 AI 应用场景,比如 AI 聊天、输入框的快捷指令、AI 助手等。
这个项目收集了很多使用OpenAI Vision API来对图像、视频文件和网络摄像头流进行推理的示例。项目结合了多种技术,实现了高效的图像处理和准确标注,适合开发者和研究人员进行实验和学习。
Slideflow是一个用于组织学图像分析的深度学习流水线,支持Tensorflow/Keras和PyTorch。它提供了一个便捷的环境来构建和管理图像分析工作流程,具有良好的可扩展性,可以满足各种图像分析需求。
MLX Data是一个高效的跨框架数据加载库,旨在与PyTorch、Jax或MLX一起使用,既高效又灵活。它每秒可以加载和处理数千张图像,并能对生成的批次运行任意Python转换,适用于各种深度学习任务。
TransferAttack是一个基于PyTorch的框架,旨在提升图像分类中的对抗性传递性,提供评估和攻击模型的功能,并对已有的传递性攻击进行分类和评估。
llamafile项目旨在通过创建一个单一的文件,简化大型语言模型(LLM)的分发和运行过程。用户可以在大多数计算机上本地运行这些模型,无需任何安装,从而保证数据隐私性,所有处理都在本地完成。该项目结合了llama.cpp与Cosmopolitan Libc,支持多个操作系统,致力于实现AI开发者的‘一次构建,随处运行’的梦想。
gptcommit 是一个开源工具,专门用于生成 Commit log,能够通过快速理解代码逻辑和 diff 来归纳出概要,帮助开发者更好地管理版本控制。