该项目提供了高效大语言模型的文献综述,涵盖最新的研究进展和技术,适用于研究人员和开发者的参考资料,并支持多种应用场景的分析。
这是一个关于大规模语言模型的精彩集合,汇聚了最新的研究成果和资源,包括论文、技术进展以及各种语言模型的比较和评估,支持社区的贡献和反馈。
Awesome-Agent4SE是一个关于软件工程中Agent的资源列表,汇集了大量关于如何将大型语言模型(LLM)应用于软件工程领域的研究论文。该项目旨在帮助开发者和研究人员更好地理解和利用这些技术,以提升软件开发的效率和质量。通过提供全面的调查、现状和未来展望,Awesome-Agent4SE成为了一个宝贵的资源库,适用于学术研究、开发项目以及教学培训。
本项目收录了关于大型语言模型(LLM)作为优化器的关键论文,并提供了自动优化相关文献的全面列表,专注于如何优化提示以提高LLM的性能,涵盖了最新的研究进展和技术。
智能优化版Llama.cpp:基于原版Llama.cpp的克隆项目,它增加了最先进的量化技术,并针对CPU性能进行了改进,使得在处理大型语言模型时更加高效
该项目是一个多模态大语言模型在数学、STEM及编程领域的论文集合,旨在整合和分享最新的研究成果,推动相关领域的创新与发展。
面向生产的大语言模型构建指南配套代码,提供丰富的Jupyter笔记本,帮助开发者深入理解和实践LLM的应用开发。该项目旨在帮助开发者通过实际操作掌握大语言模型的构建与应用,通过示例代码和文档支持自学和项目开发。
一个Python应用开发框架,可以在几分钟内构建类似ChatGPT的用户界面,支持多种元素管理和云部署,适合快速开发和部署聊天机器人及互动应用。
一个收集大语言模型算法(应用)工程师相关的知识及面试题的仓库,涵盖基础知识、实用面试问题、算法实现和应用案例,支持工程师的学习和面试准备。
Thelo是一个帮助用户选择合适的语言模型(LLM)供应商的平台,它不仅优化各类提示的响应,还能为每个提示找到最佳且最具成本效益的解决方案。通过使用Thelo,用户可以轻松比较不同供应商的性能和价格,从而做出明智的决策。
TensorZero是一个开源基础设施,旨在支持生产级、可扩展和复杂的大型语言模型(LLM)系统。它集成了推理、可观测性、优化和实验功能,支持多步骤LLM系统,并通过ClickHouse数据仓库实现实时、可扩展且开发者友好的分析。