2025年最强大的10个检索增强生成AI工具推荐 | 第 2 页

Foundations of LLMs开源项目 – 大语言模型系统教材

本书是由浙江大学开源的大语言模型教材，系统介绍大模型相关基础知识和前沿技术。涵盖传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六大主题。每章配有相关论文列表，定期更新以跟踪最新技术进展。

0

Prompt工程前沿技术参数高效微调大语言模型基础知识

Phi2-mini-Chinese开源项目 – 从零开始训练中文小模型

Phi2-mini-Chinese 是一个从零开始训练自己的Phi2中文小模型的项目，支持加载本地知识库进行检索增强生成（RAG），旨在提供强大的中文对话能力和灵活的训练选项。

0

中文对话能力从零开始训练中文模型检索增强生成自定义数据集训练

Zilliz Cloud Pipelines官网 – AI驱动的检索服务

Zilliz Cloud Pipelines 是一个AI驱动的检索服务，旨在帮助AI应用开发者专注于构建自定义的AI应用，例如RAG，同时优化质量和简化开发运维流程。

0

AI驱动的检索服务开发运维优化检索增强生成自定义AI应用

Embedefy官网 – 简化获取嵌入的过程

Embedefy简化了获取嵌入的过程，使得增强各种AI应用变得更加容易。它提供了一个简单的API来检索文本的嵌入，适用于检索增强生成（RAG）、语义搜索等多种AI应用。此外，Embedefy的PostgreSQL扩展允许用户从数据库中直接访问嵌入，无需构建和维护额外的应用程序。

0

AI应用增强PostgreSQL扩展嵌入获取工具检索增强生成

Text Embeddings Inference开源项目 – 超快的文本嵌入推断解决方案

这是一个超快的文本嵌入模型推断解决方案，支持多种文本嵌入模型，易于集成和使用，具有高效的资源管理能力。

0

API集成批量处理文本嵌入推断高效资源管理

利用语言大模型改进文本嵌入-简单有效的文本嵌入方法

该论文介绍了一种新颖且简单的方法，仅使用合成数据和不到1,000个训练步骤即可获得高质量文本嵌入。它利用专有的LLM生成了多样的合成数据，用于处理几乎100种语言中的数十万个文本嵌入任务。

0

信息检索多语言处理文本嵌入机器翻译

Llama2 Embeddings FastAPI Service开源项目 – 高效的文本嵌入服务

一个基于FastAPI的Llama2嵌入服务，旨在提供高效的文本嵌入功能。该服务通过RESTful API接口，支持多种输入格式，能够快速生成文本嵌入，方便用户集成到现有的应用程序或机器学习管道中。

0

FastAPILlama2嵌入服务RESTful API文本嵌入

EmbedJs开源项目 – 简化与大型语言模型的交互

EmbedJs是一个基于Node.js的RAG框架，旨在简化与大型语言模型（LLM）和嵌入工作的流程，支持个性化的LLM响应，使得开发者能够更高效地构建智能应用。

0

Node.js与大型语言模型交互RAG框架个性化聊天机器人文本数据嵌入与分析

sqlite-lembed开源项目 – 用于文本嵌入生成的SQLite扩展

这是一个正在开发中的SQLite扩展，旨在使用llama.cpp生成文本嵌入，适用于文本语义搜索和分析。

0

SQLite扩展开源项目文本嵌入生成语义搜索

getTxt.AI官网 – 强大的文本提取API

getTxt.AI是一个强大的文本提取API，用户可以从多种文件类型中提取文本和Markdown，包括文档、音频、图像和视频。它简化了将这些文件转换为可用文本格式的过程，使开发人员能够将文本处理能力集成到他们的应用程序中，并自动化工作流程。支持超过50种语言，并具有文本摘要和翻译等功能，是任何需要高质量文本提取的AI应用的必备工具。

0

多语言支持文本提取API文本摘要文本翻译

Towhee开源项目 – 开源嵌入框架，处理非结构化数据

Towhee 是一个开源的嵌入框架与社区，旨在帮助用户使用深度学习的方法处理非结构化数据，如图片、视频和自然语言。

0

图像嵌入开源嵌入框架深度学习自然语言处理

Ollama开源项目 – 本地AI大模型管理框架

Ollama 是一个轻量级、可扩展的框架，旨在让用户能够轻松地在本地运行和自定义大语言模型。它支持多种大语言模型，包括 Llama 3.1、Phi 3、Mistral、Gemma 2 等，并提供 OllamaGenerator 和 OllamaChatGenerator 组件，用于集成到 Haystack 2.0 管道中。Ollama 还支持自定义和创建自己的模型，提供方便的 Docker 容器部署方法，并支持文本嵌入和文档嵌入功能。此外，Ollama 在单机部署效率上提升了3倍，支持多平台（Windows/Mac/Linux）和硬件适配（自动识别CPU/GPU/NPU算力）。

0

Docker部署Ollama框架文本嵌入本地大语言模型

AnglE开源项目 – 新一代文本嵌入优化模型

AnglE是最新的文本嵌入模型，旨在优化文本嵌入，作为新一代的语义文本相似度方法，取得了新的最先进(SOTA)结果。它提供了预训练模型，包括语言模型(LLM)和数据集。

0

文本嵌入模型机器学习应用自然语言处理语义文本相似度

NLPretext开源项目 – NLP文本预处理库

NLPretext是一个综合性的NLP文本预处理库，提供多种文本处理功能，旨在为各种NLP用例提供高效和灵活的解决方案。它支持大规模文本数据的高效处理，并且允许用户根据需求定制预处理选项，方便集成和使用。

0

NLP文本预处理库分词文本向量化文本清洗

Infinity开源项目 – 高吞吐、低延迟的向量嵌入服务

Infinity是一个高吞吐、低延迟的REST API，专为向量嵌入服务而设计，支持多种sentence-transformer模型和灵活的框架兼容性，旨在提升机器学习和自然语言处理任务的效率和性能。