minRAG是一个从零开始的检索增强生成(RAG)系统,追求极简和强大,代码量控制在10,000行以内,无需安装,双击即可启动。它支持多个AI平台,如OpenAI、Gitee AI、百度千帆、腾讯云LKE、阿里云百炼、字节火山引擎等,通过结合语言模型和信息检索技术,提高文本生成的质量和准确性。
php-rag 是一个结合大型语言模型(LLM)和文档检索能力的应用,主要用于企业内部网络的 RAG(检索增强生成)应用。它支持多种 LLM,包括 DeepSeek、GPT-4o 等,并使用 PHP 开发。通过整合信息检索和文本生成,该系统显著提高了信息处理的效率和准确性,同时增强了个性化服务体验,并优化了服务流程和决策支持。
Chroma 是一款面向人工智能的开源嵌入式数据库,旨在帮助开发者轻松构建 Python 或 JavaScript 的大型语言模型(LLM)应用程序。它通过使用 Sentence Transformers 的深度神经网络模型自动生成文本嵌入,适用于信息检索、相似文档搜索和 LLM 增强等应用场景。Chroma 提供了直观的 API、完善的功能集以及与其他工具的集成,显著简化并加速了 LLM 应用程序的开发。
MS-MARCO-Web-Search是一个大规模且信息丰富的网页数据集,包含数百万个真实点击的查询-文档标签,旨在模拟现实世界的网页和查询分布,支持多种下游任务。
Lightning IR 是一个基于 PyTorch Lightning 的库,专门用于微调和运行基于 transformer 的语言模型进行信息检索任务。它提供了完整的解决方案,支持多种信息检索任务和数据集,简化了模型训练和推理过程,同时易于扩展和定制。
基于Langchain框架的RAG实践指南,专注于高级检索增强生成(RAG)技术的应用与实现。该项目提供详细的实践指南、丰富的示例代码和文档,帮助用户快速上手和深入理解RAG技术,支持多种数据源和检索方法,增强系统的灵活性和适应性。
FastGPT是一个企业级知识库系统,支持RAG+LLM的私有化部署方案,具有高准确率的文档解析和快速的问答响应时间。它采用混合检索引擎,结合BM25关键词和ColBERT语义搜索技术,提供高效的信息检索能力。此外,FastGPT还提供了操作流设计,允许用户可视化构建数据处理链路,并支持多模型兼容,可以灵活切换本地或云端的AI大模型。
DeepSeek-r1是一个结合推理模型和代理循环的检索增强生成(RAG)系统,旨在通过逻辑推理与递归检索提升处理复杂查询的性能。它通过推理层进行信息的递归检索和推理,能够准确回答复杂查询,并结合Tavily检索网络信息。系统能够过滤不相关数据,保留相关信息,并判断RAG检索到的信息是否充分,不充分则重新检索。
该项目是一个利用Diffbot和Neo4j技术构建的新闻知识图谱聊天机器人。它能够从海量新闻文章中提取关键信息,并将其转化为结构化的知识图谱。通过聊天界面,用户可以输入与新闻相关的问题,机器人能够快速检索知识图谱并给出精准答案。该项目结合了自然语言处理技术,提升了用户交互体验,适用于新闻阅读、信息检索等场景。
Doti是一个基于AI的搜索工具,帮助团队快速找到答案和洞察,通过统一平台上的数据,用户可以通过Slack、网络界面或Chrome扩展提问,甚至可以使用Doti Memos添加信息,从而实现无缝的信息检索。
用Langchain, ColBERT, Ragatouille 和 ChromaDB构建高级 RAG 系统,有效地提取 Mixtral 8x7B 生成高质量答案所需的所有相关上下文。该系统整合了多种先进技术,能够高效处理信息并生成准确的答案,适合多种应用场景。
DeepSeek是一个基于AI的对话平台,旨在通过自然语言处理技术提供智能问答和信息检索服务。用户可以与DeepSeek进行互动,获取所需的信息和建议。
Google AI Plugin是一个聚合多个AI API的Chrome扩展,旨在提升用户的生产力和体验。它支持内容写作、文本翻译、代码生成和信息检索,提供多样化的解决方案,用户无需切换平台即可使用集成的AI服务。
Ncurator是一个个人AI助手,帮助用户管理数据,通过用户查询组织和检索信息。它整合本地文件和网页文档,创建个性化知识库,提供精确的语义搜索能力,快速找到相关数据。
AskMan Chrome Extension 是一个开源工具,通过可定制的提示和支持OpenAI兼容格式的协议,提升网页浏览体验。它还提供免费的API试用,便于用户测试其功能。
Lightening 是一个强大的工具,旨在帮助用户在海量文档和文本中快速找到所需的信息。用户只需用自然语言输入查询,Lightening 会智能处理并提供相关答案,提升信息检索的效率和准确性。
Emplode Search是一个基于人工智能的问答引擎,采用生成式用户界面,旨在提供简洁而高效的答案搜索体验。它通过Emplode技术的支持,能够快速理解用户查询并提供相关的答案,提升信息检索的效率和准确性。
AI Sidekick是一个先进的工具,旨在为Slack中的团队提供宝贵的洞察和支持,专注于提升生产力、士气,防止职业倦怠。作为全知的执行助理,AI Sidekick旨在简化沟通,提供快速答案,并为团队成员提供可定制的问答解决方案。
Similarities是一个用于计算相似度和进行语义搜索的工具包,支持文本和图像,方便即用。
OpenSearch AI 是一款用户友好的 AI 搜索引擎,能够直接回答用户查询,提供精准答案,自动总结要点,生成提纲和思维导图,并允许从数十亿文献来源中下载信息。它提升了信息检索效率,提供快速、无广告、高质量的搜索服务。
ChatBees.AI是一款优化的聊天和搜索工具,能够跨多个数据源进行交互,包括PDF、CSV、网站、Google Drive、Notion、Confluence等。它在检索增强生成(RAG)质量方面表现优异,得分为4.6,远超OpenAI Assistant的3.4,大幅提升客户支持和员工培训的效率。
SearchPlus是一个AI驱动的工具,允许用户以对话方式与PDF文档互动,创新性地改变了用户与数字图书馆的互动方式,提供独特的对话式文档分析和信息检索体验。
Supermemory是一个创新的AI工具,旨在作为您的个人数字大脑,提供一整套功能,帮助用户高效组织、搜索和利用保存的信息。该平台特别适合需要轻松管理大量数据的用户,如学生、专业人士或普通互联网用户。通过强大的搜索引擎、直观的写作助手和多功能画布,Supermemory改变了您与数字信息的互动方式,使其更易于访问和使用。
Findr是一个基于AI的工具,旨在简化多个工作应用程序之间的信息搜索和检索。它提供一个集中式搜索栏,让用户能够快速找到文档、电子邮件、工单等信息。Findr通过AI驱动的功能,用户可以获得即时答案、生成摘要,甚至使用从各个集成应用程序中提取的信息来撰写电子邮件。
Bagoodex是一款先进的AI工具,旨在提升私营和企业环境中的搜索和聊天功能的效率与效果。其核心目的是优化信息检索和沟通流程,是希望简化操作和提高生产力的企业的重要资产。
MIT证明,机器能够理解含义,哪怕它本来只是训练用作预测下一个字符(LLM)。
一种 LLM 代理系统,旨在解决大型语言模型在处理长输入时的限制,通过有效上下文长度的显著增加来提升阅读理解能力。
Self-Retrieval是一个基于大型语言模型(LLM)的自我检索系统,旨在提高信息检索的准确性和效率。它支持多种数据源的检索,并提供用户友好的界面,适用于多种场景。
Scira 是一个极简主义的 AI 驱动搜索引擎,支持多种 AI 模型(如 Grok 2.0、DeepSeek、Claude 等),能够快速检索互联网信息,涵盖学术、编程、天气、地图导航、视频搜索等多种功能。它提供深度研究模式(Extreme 模式),可自主制定研究计划、进行内容分析并生成详细报告。Scira 基于 Vercel AI SDK,开源且高度可定制,适合学术、行业研究及日常信息查询。
JARVIS是一个基于Python开发的聊天机器人,具有图形用户界面,能够为用户提供实时聊天、信息检索和每日新闻服务。