标签：多模态协同

人类感知3D（HA3D）：视觉语言导航的未来

本文探讨了NeurIPS 2024精选论文中关于人类感知3D（HA3D）在视觉语言导航（VLN）中的应用。通过创建HA3D模拟器和扩展R2R数据集，研究提出了两种新的导航agent...

AI快讯

4个月前

本期内容聚焦于NeurIPS 2024精选论文解读，重点介绍了《EEG2Video：基于脑电信号解码动态视觉感知》的研究成果。该论文提出了新数据集SEED-DV和创新解码框架E...

AI快讯

4个月前