所有AI工具AI图像工具AI开发框架AI开源项目

ViDoRAG开源项目 – 视觉文档检索与生成框架

ViDoRAG是一个专为复杂视觉文档的检索和生成任务设计的框架。它通过引入ViDoSeek数据集和GMM多模态混合检索策略,显著提升了检索效率和生成质量。此外,多Agent动态迭代推理框架的...

标签:

AI交流(进群备注:ViDoRAG)

ViDoRAG是一个专为复杂视觉文档的检索和生成任务设计的框架。它通过引入ViDoSeek数据集和GMM多模态混合检索策略,显著提升了检索效率和生成质量。此外,多Agent动态迭代推理框架的引入,进一步增强了模型的抗噪能力和生成性能,整体性能提升超过10%。

ViDoRAG的特点:

  • 1. 提出ViDoSeek数据集,专为视觉文档检索增强生成设计,涵盖丰富视觉元素
  • 2. 创新性地引入GMM多模态混合检索策略,提升检索效率
  • 3. 多Agent动态迭代推理框架,显著提升模型的抗噪能力和生成质量,性能提升超过10%

ViDoRAG的功能:

  • 1. 复杂视觉文档的检索任务
  • 2. 视觉文档的生成任务
  • 3. 多模态混合检索策略的应用
  • 4. 动态迭代推理框架的使用

相关导航

暂无评论

暂无评论...