面向生产的大语言模型构建指南配套代码,提供丰富的Jupyter笔记本,帮助开发者深入理解和实践LLM的应用开发。该项目旨在帮助开发者通过实际操作掌握大语言模型的构建与应用,通过示例代码和文档支持自学和项目开发。
本项目旨在分享大模型相关技术原理以及实战经验,包括大模型工程化和应用落地,降低学习难度,促进技术普及。
为视觉-语言模型(例如CLIP)提供精心策划的Prompt/Adapter学习方法列表,包含最新的研究进展和代码实现,促进模型的高效学习和应用
清华大学构建的开源、大规模、高质量的指令调优数据项目,旨在帮助开发者构建具备通用工具使用能力的大型语言模型。
《动手学大模型》是一本开源书籍,共12章节,涵盖从基础到高级的大语言模型内容,包括语言模型介绍、文本分类、提示词工程、语义搜索、微调模型、多模态模型等。书中包含大量代码示例,可直接在Colab运行,帮助读者更好地理解和应用大语言模型。此外,书中还提供了丰富的实践代码,旨在帮助读者掌握大型语言模型的使用和应用,适合初学者和有经验的开发者。
该项目提供了高效大语言模型的文献综述,涵盖最新的研究进展和技术,适用于研究人员和开发者的参考资料,并支持多种应用场景的分析。
LLM应用实例教程,涵盖langchain、openai、llamaindex、gpt、chromadb和pinecone等多个工具和技术,提供详细的使用指南和示例,帮助开发者快速上手并实现AI应用。
LMDeploy是一个开源的大模型部署工具,旨在将复杂模型高效地部署到生产环境中,特别适合急需将AI大模型推向市场的团队。它提供了一系列功能,包括模型量化、推理加速、动态调度、硬件适配和服务封装,帮助用户快速集成和扩展大模型能力。
汇总人工反馈强化学习(RLHF)算法的资料库,旨在整理RLHF相关论文和博客,帮助理解如何通过人工反馈优化大型语言模型
mlc-llm 使每个人都能在每个人的设备上本地开发、优化和部署 AI 模型,支持多种 AI 模型架构,并提供模型优化工具和简化的部署过程。
FastMCP是一个快速构建Model Context Protocol(MCP)服务器的Python框架,提供了简洁的API接口来构建LLM上下文服务。它支持工具函数、资源访问、提示词模板等功能,特别适合为Claude等LLM应用提供数据和功能支持。