LLM-Dojo是一个开源大模型学习场,提供简洁易读的代码框架,支持多种主流模型的训练和强化学习技术,旨在帮助AI爱好者和研究者进行深入的研究和开发。
AtomGPT是基于LLaMA的模型架构,通过从零开始训练,旨在展示模型的进化过程及学习能力的提升,帮助研究人员深入理解模型的学习过程。
midGPT是一个基于Jax和Equinox的大型语言模型分布式预训练框架,能够在云TPU切片上高效训练数十亿参数的GPT风格解码器模型,旨在提升语言模型的训练效率和性能。
实时、精细的大型语言模型合成数据资源列表,专注于为大型语言模型(LLM)提供数据支持,包括数据生成、优化和应用。
吴恩达的课程,旨在引导学员完成LLM预训练流程,包括数据准备、模型架构配置、训练和评估。学员将学习如何使用HuggingFace获取训练数据,配置Transformer网络,运行训练并进行性能评估,同时探讨深度升级技术以降低计算成本。
Prompt2Model 是一个从自然语言指令生成可部署模型的工具,旨在帮助系统构建者通过自然语言描述任务并提供示例来创建自然语言处理系统。
在部署语言模型前,评估其在特定领域生成事实性信息的能力很重要。我们提出了方法,通过语料库转换自动生成,以评估模型从语料库生成真实事实而非不正确陈述的能力。我们创建了两个基准,并发现基准分数与模型大小和检索增强相关,但在模型排名上并不总是与困惑度一致。
这是我在伯克利带的本科生Peter Tong去New York University师从Xie Saining和Yann LeCun后对目前所有主要大模型进行系统研究测试的最新工作。
DevOps-Eval是一个专门为DevOps领域大模型设计的综合评估数据集,提供了工业优先的评估基准和专用的数据集,以支持多种评估方法,适用于大规模语言模型的性能测试。
这是一个专注于应用于网络安全的强化学习资源的精心整理列表,包含研究论文、实用实现和相关工具,旨在帮助研究人员和开发者在这一领域获得最新的信息和技术支持。
spelltest 是一个专为语言模型设计的测试工具,能够自动生成测试用例,评估模型性能,并提供详细的测试报告。它支持多种语言模型,用户可以根据需要定制测试参数,以便更好地适应不同的测试场景。
机器学习实战资料(Jupyter Notebooks) - 通过在Jupyter Notebooks中实验最先进的机器学习模型和算法进行学习。
研究人员设计了一种'好奇回放'算法,让AI智能体优先回放那些最有趣和新奇的经历,从中学习。这种方式让AI智能体表现出更多的好奇心和探索欲,更快地接近和与新物体互动。
AnySkill是一个用于交互代理的开放词汇物理技能学习项目,旨在提升交互代理在多种物理技能上的学习能力。该项目通过创新的方法使代理能够在未见过的技能上进行学习,进而实现更灵活的交互和应用。
Vercel AI Playground是一个在线平台,允许用户使用最新的AI语言模型构建AI驱动的应用程序。它提供了一系列功能来微调模型,例如并排比较模型的Compare Mode和优化参数的Tweak Mode。