研究人员设计了一种'好奇回放'算法,让AI智能体优先回放那些最有趣和新奇的经历,从中学习。这种方式让AI智能体表现出更多的好奇心和探索欲,更快地接近和与新物体互动。
RLx2是清华大学团队提出的一种强化学习专用的稀疏训练框架,能够完全基于稀疏网络训练深度强化学习模型。
FAMIE是一个快速的主动学习框架,专注于多语言信息抽取,旨在提高数据处理和模型优化的效率。它支持多种语言的信息抽取,提供用户友好的界面和灵活的模型配置,结合高效的数据标注工具,适用于快速迭代和评估不同的学习策略。
iX 是一个自主的GPT-4智能体平台,旨在设计和部署半自主LLM智能体,提供了一种可扩展和响应迅速的解决方案,用于将任务委派给AI驱动的智能体。
Griffin是一种将门控线性RNN与局部注意力混合在一起的新模型架构,表现优于以往模型,能够处理长上下文并扩展到14B参数。该模型在训练数据量减少的情况下,仍能保持优异的表现,显著改善预测能力,并保留了Transformer架构在合成任务上的许多优点。
LLM-Dojo是一个开源大模型学习场,提供简洁易读的代码框架,支持多种主流模型的训练和强化学习技术,旨在帮助AI爱好者和研究者进行深入的研究和开发。