旨在促进能在IMO竞赛中赢得金牌的开放共享AI模型诞生的比赛,设立于2023年11月。
Imbue是一个创新工具,旨在彻底改变个人计算机的概念,专注于创建能够实现更大目标并在现实世界中安全操作的实用AI代理。该工具特别适合那些热衷于重新构想计算机并重视技术高自主性的人群,提供显著的效率和效果优势。
PRM800K是一个用于训练过程监督奖励模型(PRM)的数据集,旨在提高大型语言模型在复杂推理任务中的准确性,尤其是在数学问题上。该数据集包含800K个步进级标签,覆盖12K个问题的75K个解决方案,使用主动学习技术选择最具信息量的数据样本进行人工注释,从而提供细粒度反馈,通过评估中间推理步骤来改进结果,最终提高解决率,从42.5%提升到78%在MATH数据集子集上。
iGSM是一个用于生成小学数学问题数据集的工具,能够创建不同难度级别的数学问题,并评估解决方案的正确性。该工具旨在帮助研究人员分析语言模型在数学推理方面的能力,同时创建可用于教育和研究的数据集。
用于协调多个大型语言模型(LLM)的系统,通过迭代反馈和共识达成,来解决复杂问题
yesBrain是一个让用户轻松使用任何数据训练自己AI模型的平台。用户可以聊天、订阅其他人训练好的AI模型,分享自己的AI并获得奖励。
该论文提出了一种训练语言模型的方法,通过同时预测多个未来Token来提高样本效率,并在多个生成基准上实现了显著的性能提升。
NVIDIA官方推出的库,用于压缩transformer模型中的KV缓存,最大可节省约35%的内存空间。kvpress通过多种缓存修剪方法,使大型语言模型的缓存压缩变得简单,降低内存使用并提高解码速度。