构建企业级 RAG 系统指南,通过 5 个循序渐进的 Jupyter notebooks,指导开发者从零开始构建、优化和部署企业级 RAG 系统,涵盖从基础配置到高级技术的全过程实践。
这是一组简短的(5-10分钟视频)和笔记,解释了我最喜欢的十几篇RAG论文,包含开源实现和代码。
bRAG-langchain 是一个完整的从入门到高级的RAG构建指南,适合想要深入学习和实践RAG技术的开发者。项目提供了从基础设置到高级应用的完整学习路径,涵盖查询构建、路由、索引、检索和生成的完整流程。通过多个 Jupyter Notebook,开发者可以逐步实现从简单到复杂的 RAG 应用,并掌握高级检索与重排技术。
一个开源的本地RAG系统,支持多种大模型集成方案。可通过本地Ollama部署、ChatGPT自定义GPT或Anthropic Claude进行本地文件查询。
myGPTBrain是一个高效的工具,允许用户无缝上传PDF、Word文档、Excel表格,并能连接Google Drive和Notion等资源。通过分析用户上传的内容,myGPTBrain能够提供基于文档内容的上下文丰富的回答,帮助用户快速获取所需信息。
Snaplet Seed 是一个 AI 驱动的工具,帮助开发者使用 Typescript 自动为他们的关系型数据库生成真实的、类似生产环境的模拟数据。
TCM-Ancient-Books项目收录了近700项中医药古籍文本,提供了文本的格式化和结构化,支持多种搜索和查询功能,为用户提供中医药相关知识的参考。
CodeGeeX4 是一个功能全面的国产开源代码模型,集成了代码补全、生成、问答、解释器、工具调用、联网搜索、项目级代码问答等多种能力,覆盖编程开发的各个场景。它基于 GLM-4-9B 模型持续训练,显著提升了代码生成能力,支持多种编程语言和软件开发功能。
The Attic AI是一个由AI驱动的知识管理平台,旨在革新文档信息的组织和检索。它将文档转化为动态聊天机器人,使用户能够通过自然语言查询轻松快速地访问关键信息。用户可以无缝高效地存储和检索来自各种来源的信息。
连续上榜 GitHub Trending 的一款 SQL 生成 AI 框架,允许在你的数据上训练出独有的 RAG(检索增强生成)模型,通过自然语言准确生成 SQL 查询语句和相关功能。
Skipper 是用于服务组合的 HTTP 路由器和反向代理。它旨在处理具有详细查找条件的超过300k HTTP 路由定义,并使用过滤器灵活地增加请求流。它可以开箱即用,也可以通过自定义查找、过滤逻辑和配置源进行扩展。