一个用于搭建类似Perplexity的问答引擎的项目,结合了多种先进的技术和模型。
允许用户将代码项目转换为 LLM(Large Language Model)提示的本地工具,专注于安全性、便捷性和用户体验。
MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队提供。它提供了熟悉的 API 和强大的功能,支持多种计算模式和设备,旨在简化机器学习模型的构建与训练。
Alibaba LangEngine 是一个基于 Java 的 AI 应用开发框架,旨在赋予大语言模型(LLM)数据感知和Agent能力,支持多种应用场景和集成外部 API,主要应用于个人助理、文档问答、聊天机器人等场景。
CogVideoX Factory 是一个在 24GB GPU 内存下对 Cog 系列视频模型进行微调的项目,旨在实现高效的自定义视频生成,支持多种分辨率,提供内存优化的微调脚本和基于 TorchAO 和 DeepSpeed 的训练方式,适用于多种深度学习工作流。
Fast-LLM是一个开源库,旨在加速大型语言模型的训练。它具有快速的训练速度、良好的可扩展性,支持多种模型架构,并且提供易于使用的接口,适合研究和工业应用。
一个将GraphRAG技术与Dify平台结合使用的实践项目,通过HTTP服务方式将GraphRAG的知识图谱检索能力暴露给Dify使用。项目提供了完整的配置流程和DSL示例,特别针对游戏《王者荣耀》的知识库进行了实践演示,实现了基于知识图谱的智能问答系统。
Bootstrap RAG是一个便捷的项目框架,旨在帮助开发者快速搭建语义搜索和RAG(Retrieval-Augmented Generation)应用。它提供了常规模板代码,减少了开发时间,并且易于扩展与定制,适合各种项目需求。
本项目进一步增强Llama-2大模型的中文理解、生成、翻译等能力,提供多种微调和实验选项。
HQTrack 是一个高效的跟踪系统,能够准确地跟踪多种类型的目标,适用于实时视频处理,支持灵活的集成与使用。
llama2.scala是Andrej Karpathy的llama2.c在Scala 2中的移植,提供了一种在一个文件中实现Llama 2推理的方式。
LLM API 提供了一套完整的、类型安全且一致的聊天接口,支持 OpenAI、Anthropic 和 Azure 的聊天模型,能够在浏览器、边缘计算和节点环境中灵活使用。
Jax GPT是对Karpathy的nanoGPT的重写,基于Jax和Flax框架构建,旨在提供高效的文本生成能力,支持快速训练和推理,具有易于扩展和修改的架构,能够充分利用高性能的并行计算。
SynCLR是一种完全从合成图像和合成描述学习虚拟表征的方法,无需任何真实数据。它能够与OpenAI的CLIP在ImageNet上的传输效果一样好,利用合成数据获取高质量表征,适用于大模型训练中的偏好标记。
GPT Core用于创建和训练先进的大型语言模型(LLM),着重强调了其快速性能,可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失。
百川智能推出的新一代开源大语言模型,采用 2.6 万亿 Tokens 的高质量语料训练。在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。
大语言模型集成工具LangChain的TypeScript版本,支持在不依赖Python的情况下实现各种功能,如Embeddings、文本分割等。
一个简单易懂的AI代理示例项目,展示了如何通过模型上下文协议(MCP)连接开源大语言模型(如Llama 3、OpenAI或Google Gemini)和SQLite数据库,帮助开发者快速上手AI代理开发。
一种高效在单个GPU设备上部署和运行多个微调大语言模型的框架,显著降低服务成本,支持动态加载不同的适配器模型,能根据请求实时加载必要的模型权重,不影响并发请求。
FastAgency是一个多智能体工作流快速生产化工具,利用AutoGen框架,支持多种接口如控制台和Mesop,旨在灵活适应不同的应用场景,帮助开发者高效构建和管理智能体应用程序。
FauxPilot 是一个开源项目,旨在构建一个可以在本地托管的 GitHub Copilot 服务器。它基于 NVIDIA Triton 推理服务器,并使用 SalesForce CodeGen 模型,允许用户私密使用代码生成工具,同时提供开放源代码的灵活性。
在浏览器中构建AI记忆库,一个完全运行在浏览器中的向量数据库引擎,利用IndexedDB和WebAssembly技术,实现文本向量的存储和高效查询,帮助开发者轻松构建搜索系统和推荐引擎。
TestPilot 是一个利用大语言模型 (LLM) 自动为用 JavaScript/TypeScript 编写的 npm 包生成单元测试的工具,旨在提高开发效率,简化测试编写流程。
ChatGPT提示评估器是一种用于评估与ChatGPT配合使用的提示的工具,包含第二个过滤语言模型,以增强安全性和有效性。
LangUI是一个开源的Tailwind组件库,专为GPT、生成式AI和大语言模型项目设计,旨在增强AI应用的用户体验。
使用OpenAI API或Azure轻松使用ChatGPT的实用工具,注重简单架构,以提高可读性。它提供了简化的API接口,并支持多种功能,适应不同的使用场景,旨在帮助开发者快速上手并集成智能对话功能。
permchain 是一个用于使用 LLM 构建有状态的多参与者应用的开发库,扩展了 LangChain 表达式语言,能够跨多个计算步骤协调多个链(或参与者)。
Synth是一个Laravel工具,它帮助您在Laravel应用程序中生成代码并执行各种任务。它利用OpenAI的GPT语言模型的强大功能,提供交互式和智能的开发体验。
这是用于大规模药物发现的AI模型构建和适配框架,通过提供特定领域的优化模型和工具,加速构建和适配生物分子AI模型的过程,帮助研究人员更高效地进行药物研发。
一种基于Llama-2模型使用自己数据微调的方法,A100显卡就可以对70B模型微调。