小型语言模型综述资源集:旨在全面调研小型语言模型的技术、应用、效率以及与大型语言模型的协作和可信度
这是一个关于大规模语言模型的精彩集合,汇聚了最新的研究成果和资源,包括论文、技术进展以及各种语言模型的比较和评估,支持社区的贡献和反馈。
Airtrain.ai LLM Playground是一个无代码的平台,可以同时对多种开源和专有LLM(如Claude、Gemini、Mistral AI、OpenAI模型、Llama 2、Phi-2等)进行质量、性能和成本的检查与比较。该平台旨在为用户提供简便的工具,以便在选择合适的语言模型时做出明智的决策。
LLMDrift是一个项目,旨在研究大型语言模型(如GPT-3.5和GPT-4)的性能漂移,特别关注其性能可能随时间下降的趋势及其影响。
通过 LMSYS 的 Chatbot Arena 数据生成的大语言模型过去一年 ELO 的排名变化对比动画,帮助用户直观了解不同模型的表现和竞争力。
一项关于代码大语言模型的调研报告,系统地回顾了语言模型在代码处理方面的最新进展。
Google DeepMind的这篇新论文提出了一种方法,名为“通过提示进行优化”(OPRO)的简单而有效的方法,利用语言大模型(LLM)作为优化器,其中优化任务以自然语言描述。
Everyprompt是一个供用户探索和玩转最新语言模型的在线平台,用户可以构建和分享与GPT-3相关的工具,并了解人工智能的未来。
大型语言模型研究资源库,专注于OpenAI o1和推理技术,持续更新以追踪LLM推理的最新进展