标签:多模态协同
人类感知3D(HA3D):视觉语言导航的未来
本文探讨了NeurIPS 2024精选论文中关于人类感知3D(HA3D)在视觉语言导航(VLN)中的应用。通过创建HA3D模拟器和扩展R2R数据集,研究提出了两种新的导航agent...
NeurIPS 2024精选论文解读:多模态协同与SEED-DV的创新突破
本期内容聚焦于NeurIPS 2024精选论文解读,重点介绍了《EEG2Video:基于脑电信号解码动态视觉感知》的研究成果。该论文提出了新数据集SEED-DV和创新解码框架E...