在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)技术因其能够结合检索与生成的优势,近年来备受关注。然而,传统RAG系统在处理复杂查询时,往往因单次检索的局限性而表现不佳。为了解决这一问题,微软人工智能团队与中国人民大学合作,推出了全新的CoRAG(Chain-of-Retrieval Augmented Generation)框架,通过迭代检索和动态查询重构,显著提升了RAG模型的性能。
CoRAG的核心创新
CoRAG的核心创新在于其动态查询重构机制。与传统RAG系统仅依赖单次检索不同,CoRAG支持迭代搜索和推理,使得人工智能模型在生成答案前能够动态优化检索结果。这一过程确保了每个阶段检索到的信息都与上下文相关,进而逐步构建出更完整的最终答案。
此外,CoRAG采用了拒绝采样技术(Rejection Sampling),从现有的RAG数据集中生成合理的检索链,从而在无需大量昂贵的人工标注的情况下进行训练。这一方法不仅降低了训练成本,还提高了模型的泛化能力。
应用场景与性能表现
CoRAG在KILT基准测试和多跳问答任务上进行了测试,与现有的RAG模型相比,其效果得到了显著提升。特别是在需要从多个来源检索和整合信息的任务中,CoRAG表现尤为出色。这种性能提升使得CoRAG在自动研究、企业知识系统以及人工智能辅助决策等领域具有重要价值。
Durapid Technologies的创始人兼首席执行官迪普什·贾恩(Deepesh Jain)评价道:“这是RAG向前迈出的一大步!传统方法常常遗漏关键细节,而CoRAG的迭代方法让检索更智能、更具动态性。让模型像人类一样优化搜索,有望为复杂查询提供更好的答案。”
Global RAG Hack Together活动
为了进一步推广RAG技术,微软将于九月举办Global RAG Hack Together活动。参与者不仅可以学习到生成式AI下的RAG技术,还可以提交参赛作品,赢取数字勋章和500美元的参赛奖金。活动前,微软高级云技术布道师卢建晖将带来4期RAG分享课程,帮助参与者快速掌握RAG的基础知识,并解构最新的GraphRAG技术。
卢建晖作为微软高级云技术布道师,拥有丰富的技术分享经验,曾多次在微软Ignite、Teched等会议上发表演讲。他的课程将涵盖如何利用Azure AI Studio SDK结合Azure AI Search快速创建RAG解决方案,以及如何利用Visual Studio Code AI Tools完成SLM的微调和部署。
结语
CoRAG框架的推出标志着RAG技术进入了一个新的发展阶段。通过迭代检索和动态查询重构,CoRAG不仅解决了传统RAG系统的局限性,还为复杂查询提供了更智能、更准确的解决方案。随着Global RAG Hack Together活动的举办,RAG技术有望在更多领域得到广泛应用,推动人工智能技术的进一步发展。