HPT项目致力于通过结合多种预训练变换器来扩展自我感知与视觉学习的能力,旨在提高学习效率并适应多种复杂任务。
EnfinBref.io是一个基于人工智能的视频摘要工具,用户只需粘贴视频网址,即可轻松获得该视频内容的简明摘要。该工具会自动生成逐段摘要,并提取关键点,以易于消化的要点形式呈现。
Meditaia提供定制化的冥想和正念工具,帮助用户在混乱的世界中将压力转化为宁静,拥抱个性化的冥想课程,实现内心的平和、动力和深度放松。
一个专门面向长视频生成的电影级数据集,特点是包含完整电影长度的视频、连贯的故事情节和多场景叙事,确保角色外观和音频在不同场景中的一致性,并提供分层的数据结构,包含高层电影信息和详细的镜头级描述
这是一个关于人与物体物理交互的数据集,记录了人推、拉、搬不同阻力物体的动作,帮助研究者更好地理解人与物体之间的物理动态
VIGC(Visual Instruction Generation and Correction)是一个用于生成和修正视觉指令的项目,旨在提高视觉任务的效率和准确性,适用于多种视觉任务。
PaddleMIX是基于飞桨的跨模态大模型开发套件,支持图像、文本、视频等多种模态的处理,覆盖视觉语言预训练、文生图、文生视频等丰富的跨模态任务。它提供开箱即用的开发体验,同时满足开发者灵活定制的需求,旨在探索通用人工智能。此外,PaddleMIX在文档图像理解领域表现出色,特别擅长中文文档的理解与问答,具备高效的推理性能和多种部署方式。
智元灵犀X1所使用的强化学习训练代码,可配合智元灵犀X1配套的推理软件进行真机和仿真的行走调试,或导入其他机器人模型进行训练。
Typeface是一个专为企业内容创作设计的生成式AI应用,旨在通过个性化内容提升创意和增长,确保生成的内容与品牌形象和营销策略无缝对接。
UniAD是一个为自动驾驶设计的框架,旨在实现感知与决策一体化,开创全局任务为目标的自动驾驶架构。