E2M是一个强大的开源工具,可将多种文件类型如doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4a等转换为Markdown格式,便于数据检索增强生成(RAG)及模型训练或微调,支持自定义配置,易于安装和使用。
i18n-cli是一个开源项目,用于帮助网站和App支持多语言。它通过接入ChatGPT帮助自动翻译语言文件,省去翻译专业人士的费用。
Zilliz Cloud Pipelines 是一个AI驱动的检索服务,旨在帮助AI应用开发者专注于构建自定义的AI应用,例如RAG,同时优化质量和简化开发运维流程。
Portal是一款旨在将ChatGPT的能力整合到用户的工作流程中的传输工具,支持多种文件格式的高效传输,提供用户友好的界面和实时反馈机制,确保跨平台的兼容性。
NIMBO AI是一个先进的对话人工智能工具,允许用户与AI聊天并进行互动。用户可以提出任何问题,或者与任何名人的角色进行聊天。它支持从PDF、TXT、ZIP文件导入文本,进行总结、转换和翻译。此外,用户还可以通过导入WhatsApp聊天记录来模拟聊天对话,体验智能聊天的延续。
这本书教你如何构建高效、成本平衡的大型语言模型(LLM)、计算机视觉和生成式AI系统,通过RAG技术提高输出的准确性和相关性。
LLM Twin Course 是一门全面的大型语言模型(LLM)免费学习课程,教授如何构建生产级别的 LLM 和基于 LLM 的检索增强生成(RAG)系统。课程包含11节动手课程,涵盖从数据收集到部署的全过程,并提供了所有实践涉及的源码。课程内容涵盖了系统设计、数据工程、特征管道、训练管道和推理管道等方面,适合中级的机器学习工程师、数据工程师和软件工程师,需具备Python、ML和云计算的基础知识。
Korvus是一个开源的RAG(检索增强生成)管道,整合了从嵌入生成到文本生成的整个RAG工作流程,用户只需通过单一的SQL查询即可完成,显著降低了架构复杂性和延迟。
连续上榜 GitHub Trending 的一款 SQL 生成 AI 框架,允许在你的数据上训练出独有的 RAG(检索增强生成)模型,通过自然语言准确生成 SQL 查询语句和相关功能。
一个基于Llama-70B的创新文本分块策略,针对RAG应用优化,使用中文字符'段'作为特殊标记,实现自动语义分块。
Epsilla通过创新的RAG服务,简化复杂的数据检索和内容生成任务,提升数据处理能力,适用于各类企业用户。
GPT-Migrate 将存储库从一种语言/框架转换为另一种语言/框架,支持多种编程语言和框架的自动化迁移,保留原有代码的逻辑和结构,同时提供迁移后的代码质量检查,并允许用户自定义迁移规则,具有良好的可扩展性。
DONUT是一种非OCR方式的文档识别Transformer技术,性能和效果远超传统OCR技术,能够处理复杂的文档结构,包括表格和其他格式。