本书是由浙江大学开源的大语言模型教材,系统介绍大模型相关基础知识和前沿技术。涵盖传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六大主题。每章配有相关论文列表,定期更新以跟踪最新技术进展。
Phi2-mini-Chinese 是一个从零开始训练自己的Phi2中文小模型的项目,支持加载本地知识库进行检索增强生成(RAG),旨在提供强大的中文对话能力和灵活的训练选项。
Zilliz Cloud Pipelines 是一个AI驱动的检索服务,旨在帮助AI应用开发者专注于构建自定义的AI应用,例如RAG,同时优化质量和简化开发运维流程。
Embedefy简化了获取嵌入的过程,使得增强各种AI应用变得更加容易。它提供了一个简单的API来检索文本的嵌入,适用于检索增强生成(RAG)、语义搜索等多种AI应用。此外,Embedefy的PostgreSQL扩展允许用户从数据库中直接访问嵌入,无需构建和维护额外的应用程序。
这是一个超快的文本嵌入模型推断解决方案,支持多种文本嵌入模型,易于集成和使用,具有高效的资源管理能力。
该论文介绍了一种新颖且简单的方法,仅使用合成数据和不到1,000个训练步骤即可获得高质量文本嵌入。它利用专有的LLM生成了多样的合成数据,用于处理几乎100种语言中的数十万个文本嵌入任务。
一个基于FastAPI的Llama2嵌入服务,旨在提供高效的文本嵌入功能。该服务通过RESTful API接口,支持多种输入格式,能够快速生成文本嵌入,方便用户集成到现有的应用程序或机器学习管道中。
EmbedJs是一个基于Node.js的RAG框架,旨在简化与大型语言模型(LLM)和嵌入工作的流程,支持个性化的LLM响应,使得开发者能够更高效地构建智能应用。
这是一个正在开发中的SQLite扩展,旨在使用llama.cpp生成文本嵌入,适用于文本语义搜索和分析。
getTxt.AI是一个强大的文本提取API,用户可以从多种文件类型中提取文本和Markdown,包括文档、音频、图像和视频。它简化了将这些文件转换为可用文本格式的过程,使开发人员能够将文本处理能力集成到他们的应用程序中,并自动化工作流程。支持超过50种语言,并具有文本摘要和翻译等功能,是任何需要高质量文本提取的AI应用的必备工具。
Towhee 是一个开源的嵌入框架与社区,旨在帮助用户使用深度学习的方法处理非结构化数据,如图片、视频和自然语言。
Ollama 是一个轻量级、可扩展的框架,旨在让用户能够轻松地在本地运行和自定义大语言模型。它支持多种大语言模型,包括 Llama 3.1、Phi 3、Mistral、Gemma 2 等,并提供 OllamaGenerator 和 OllamaChatGenerator 组件,用于集成到 Haystack 2.0 管道中。Ollama 还支持自定义和创建自己的模型,提供方便的 Docker 容器部署方法,并支持文本嵌入和文档嵌入功能。此外,Ollama 在单机部署效率上提升了3倍,支持多平台(Windows/Mac/Linux)和硬件适配(自动识别CPU/GPU/NPU算力)。
AnglE是最新的文本嵌入模型,旨在优化文本嵌入,作为新一代的语义文本相似度方法,取得了新的最先进(SOTA)结果。它提供了预训练模型,包括语言模型(LLM)和数据集。
NLPretext是一个综合性的NLP文本预处理库,提供多种文本处理功能,旨在为各种NLP用例提供高效和灵活的解决方案。它支持大规模文本数据的高效处理,并且允许用户根据需求定制预处理选项,方便集成和使用。
Infinity是一个高吞吐、低延迟的REST API,专为向量嵌入服务而设计,支持多种sentence-transformer模型和灵活的框架兼容性,旨在提升机器学习和自然语言处理任务的效率和性能。
BrowserAI 是一种在浏览器中运行本地AI模型的工具,无需依赖服务器,既保护用户隐私,又实现快速推理。
使用AWS构建完整的数据摄取和检索API的开源项目,采用AWS Lambda进行数据摄取和检索,使用RabbitMQ进行摄取作业排队,使用自定义的Docker镜像进行数据摄取,使用Huggingface文本嵌入接口进行数据嵌入。
Humbot是一个AI人性化工具,旨在帮助用户绕过AI检测,通过将AI生成的文本转换为更自然的语言,使用户能够自信地写作。只需输入您想要人性化的文本,点击人性化按钮,等待几秒钟即可获得输出。