标签:泛化能力
探索VLA数据集:从Helix到GO-1,具身智能的未来已来
本文深入探讨了VLA数据集在具身智能领域的应用,重点分析了Figure的Helix模型和智元的GO-1模型。Helix通过自然语言控制实现多机器人协作,而GO-1则借助ViLLA...
大模型规模与说服力:Scaling Law的新视角与未来展望
本文探讨了大模型规模与说服力之间的关系,揭示了模型规模增加带来的边际效益递减现象。研究表明,当前前沿模型的单次消息说服力可能已接近天花板,而任务完...
AI手术机器人的模仿学习:从虚拟模拟到真实手术的革命
美国约翰霍普金斯大学和斯坦福大学的研究人员开发了一台AI手术机器人,通过模仿学习观看大量手术视频,并结合ChatGPT的机器学习架构,能够自主完成复杂手术操...
函数掩码技术:Hammer模型如何革新工具调用能力
OPPO研究院和上海交通大学的研究团队通过函数掩码技术,成功开发了Hammer系列模型,在工具调用任务中展现了接近或超越闭源SOTA模型(如GPT-4)的性能。本文深...
探秘Transformer模型优化:PLATON算法的突破与启示
本文深入探讨了在ICML2022上提出的PLATON算法,该算法通过重要性估计的置信上限(UCB)来捕捉Transformer模型中权重重要性得分的不确定性,从而有效减少模型大...