PIKE-RAG开源项目 – 专业领域知识增强生成系统
PIKE-RAG是微软开源的一个专注于提取和应用专业领域知识的增强生成系统,旨在解决传统RAG在处理专业领域知识时的局限性。该系统通过构建连贯的推理逻辑,逐步引导大型语言模型生成准确答案,适合处理深度领域知识和多步逻辑推理的场景。PIKE-RAG包含文档解析、知识提取、知识存储、知识检索、知识组织、以知识为中心的推理以及任务分解和协调等多个基本模块,并通过调整子模块,构建针对不同功能的RAG系统。已在医疗、工业制造、矿业等领域测试,显著提高了问答准确性,在HotpotQA数据集上准确率高达87.6%,在2WikiMultiHopQA上准确率为82.0%,在MuSiQue上准确率为59.6%。