LLM Twin Course 是一门全面的大型语言模型(LLM)免费学习课程,教授如何构建生产级别的 LLM 和基于 LLM 的检索增强生成(RAG)系统。课程包含11节动手课程,涵盖从数据收集到部署的全过程,并提供了所有实践涉及的源码。课程内容涵盖了系统设计、数据工程、特征管道、训练管道和推理管道等方面,适合中级的机器学习工程师、数据工程师和软件工程师,需具备Python、ML和云计算的基础知识。
这是一本关于在自然语言处理任务中使用大型语言模型(LLMs)的全面指南,提供有关模型、数据和下游任务的深入见解。
LLMClient是一个用于构建检索增强生成(RAG)、推理、函数调用代理、LLM智能体、追踪和日志记录的简单库,旨在帮助开发者更加高效地利用大型语言模型。
Galactic是一个用于处理大规模非结构化文本数据集的工具,提供清理和筛选功能,旨在筛选微调数据集、创建用于检索增强生成(RAG)的文档集合,甚至对LLM预训练Web规模数据集进行去重。
高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术
E2M是一个强大的开源工具,可将多种文件类型如doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4a等转换为Markdown格式,便于数据检索增强生成(RAG)及模型训练或微调,支持自定义配置,易于安装和使用。
这是一个基于项目的课程,旨在教授MLOps的基础知识,重点关注直观理解和应用。课程涵盖真实世界的MLOps场景,通过理论与实践相结合的方式,全面介绍MLOps中使用的工具和技术,并强调模型部署和监控的最佳实践,同时提供社区支持和持续学习的资源。