本文调查了快速发展的指令调优 (IT) 领域的研究工作,这是增强大型语言模型 (LLM) 功能和可控性的关键技术。
Deita旨在为大型语言模型(LLM)的指令微调提供自动数据选择工具和高质量的对齐数据集,Deita模型能通过比其他SOTA LLM少10倍的指令微调数据进行训练,达到与它们相媲美的性能。
liteLLM是一个开源库,旨在简化LLM(大语言模型)的完成和嵌入调用。它提供了一个方便易用的接口,使得调用不同的LLM模型变得更加简单。用户只需导入'litellm'库并设置必要的环境变量(如OPENAI_API_KEY和COHERE_API_KEY),即可创建Python函数并使用liteLLM进行LLM完成调用。此外,liteLLM还提供了一个演示平台,用户可以在其中编写Python代码并查看输出,从而比较不同的LLM模型。
PyLLMCore是一个提供与大型语言模型轻量级接口的Python库,旨在简化与LLM的交互,使开发者能够轻松集成和使用各种语言模型。
本项目对大型语言模型中的上下文长度扩展进行了详细调研,讨论了现有策略、评估复杂性及研究者面临的挑战。
1000gpt是一个平台,提供由个人创作的各种定制GPT模型。用户可以根据自己的需求找到合适的语言模型,充分释放人工智能的潜力。
Vercel AI Playground是一个免费的AI Playground,允许用户对比测试多种AI模型,并比较和调整AI语言模型。它提供一个用户友好的界面,支持多种AI提供商,用户可以实时调整和比较不同模型的输出。
CSGHub是一个开源的、可信的大模型资产管理平台,旨在帮助用户管理与大型语言模型及其应用(如数据集、模型文件、代码等)生命周期相关的资产。
mm-cot是亚马逊开源的多模态链式思维(Multi-modal Chain of Thought)模型,旨在提升大语言模型在复杂任务中的表现。它支持多模态输入,包括文本和图像,并通过链式思维增强推理能力,特别针对复杂任务进行了优化的架构设计,方便研究人员和开发者进行二次开发。
shell-ask是一个终端工具,允许用户直接询问语言模型,支持多种语言模型,旨在快速获取问题答案,从而简化命令行交互过程。
PromptStacks是一个社区驱动的平台,用户可以分享和发现生成式AI的技巧、窍门和资源,旨在帮助用户在AI领域保持领先。提供免费审核的提示和全面的课程,用户可以参与讨论、分享提示并获得反馈。
LlamaIndex(原名GPT Index)是一个开源工具,专注于将大型语言模型(LLMs)与外部数据源集成,帮助开发者构建更强大的问答系统和知识库应用。它提供了一种结构化的方式来管理LLM的数据,支持多种数据源和索引策略,旨在提升LLM应用的开发效率和数据检索性能。
LLM Pricing是一个聚合和比较各种大型语言模型(LLMs)定价信息的网站,旨在帮助用户找到适合其项目的最佳LLM定价。用户可以访问网站并导航到定价比较页面,选择感兴趣的LLM并并排比较其定价信息。
这篇论文对大语言模型的微调,从技术、研究、最佳实践、应用研究挑战和机遇等方面进行了详尽的回顾。
本项目收录了关于大型语言模型(LLM)作为优化器的关键论文,并提供了自动优化相关文献的全面列表,专注于如何优化提示以提高LLM的性能,涵盖了最新的研究进展和技术。