BLOOMZ是由BigScience和Hugging Face开发的多语言大语言模型系列,通过对BLOOM和mT5预训练模型进行跨语言任务混合(xP3)微调,实现在46种自然语言和13种编程语言中的零样本指令跟随能力。支持从300M到176B的多种参数规模,适用于翻译、内容生成、概念解释等多样化NLP任务。
指令回译是一种可扩展的方法,通过自动为人类编写的文本添加相应的指令标签,从而构建一个高质量的指令跟随语言模型。该方法在生成和筛选训练样例方面表现出色,并且可以微调现有模型以提高性能。
一款用于生成和优化语言模型提示的工具,支持从零开始创建提示或将现有提示转换为Claude3提示,以提高输出效果和对齐度
一本从机器学习的基础知识开始,一步步地建立您对语言模型的理解的书。官网上可以在线阅读但不能下载。
在部署语言模型前,评估其在特定领域生成事实性信息的能力很重要。我们提出了方法,通过语料库转换自动生成,以评估模型从语料库生成真实事实而非不正确陈述的能力。我们创建了两个基准,并发现基准分数与模型大小和检索增强相关,但在模型排名上并不总是与困惑度一致。
LaMini-LM是一个对多个迷你大语言模型进行微调的项目,旨在提升模型的性能,其中包括经过微调的GPT-2,其性能可与LLaMa的Alpaca-7B相媲美。
Palaxy是一个AI驱动的提示助手,通过提供丰富的灵感来简化提示工程过程。它可以节省时间并提升技能,只需点击一下即可优化提示。