Portal 360是一个增强现实应用,允许用户查看和创建360度照片和视频。用户可以通过该应用探索令人惊叹的风景和地点,轻松制作令人印象深刻的360度内容。
SplattingAvatar是一个基于网格嵌入的高斯散射技术的项目,能够实时生成高质量的人类头像,适用于虚拟和增强现实应用以及动画和游戏开发。
该项目专注于开发持续的场景表示,以增强具身AI系统的能力,支持实时场景理解和动态环境中的导航与交互。
uCO3D是一个3D世界中的罕见物体数据库,包含约17万旋转台视频捕捉来自LVIS分类体系的物体,提供原始视频、对象分割、相机姿态和3种点云数据,是3D视觉研究的宝贵资源。
MVSplat360 是一个用于快速生成 360 度场景的项目,利用稀疏视图进行前馈生成,旨在为虚拟现实和增强现实提供高质量的场景合成。
SchurVINS是一个基于Schur补的轻量级视觉惯性导航系统,旨在提供高效且准确的导航能力。
MPS-Net是一个用于从单目视频中捕捉人类运动的模型,专注于时间注意的3D人体姿势和形状估计。该项目通过先进的算法,能够准确地捕捉到人类在运动中的动态变化,为动作分析和交互式应用提供了强有力的支持。
PoseFormerV2通过利用频域分析,提供高效且鲁棒的3D人类姿态估计,能够在各种条件下表现出色。
3D Scan Pro利用激光雷达技术和摄影测量法,将现实中的物体转化为精确的3D模型,简化了日常物品的数字化过程。用户可以轻松捕捉和保存物体的三维信息,便于后续使用。
Pixelier 是一款利用增强现实技术将视频与照片结合的应用,旨在帮助用户保存特殊的回忆,分享怀旧的礼物,装饰个性化海报空间,并通过互动体验提升庆祝活动的乐趣。
visionZoo是一款利用Vision Pro技术,让用户能够在现实空间中放置3D动物模型的应用。用户可以通过这款应用体验到与动物互动的乐趣,例如复活恐龙,或者与鲨鱼和鲸鱼一起潜水,探索海洋的深处。
Navi for Vision Pro 是一款专为增强现实设备设计的应用,旨在为用户提供实时的字幕和翻译功能。通过这款应用,用户可以在与他人交流时,获得即时的语言翻译和字幕显示,极大地提升了跨语言沟通的便利性。
Akkadu是一个实时AI字幕工具,帮助用户以自己的语言轻松理解视频、网络研讨会、视频会议和直播,支持90多种语言,并兼容多种平台。
Hey Watcher AI是一款免费的YouTube视频翻译工具,能够将YouTube视频转换为用户所需语言,让用户无障碍享受各类视频内容。该项目消除了语言之间的障碍,帮助用户更好地理解和欣赏全球视频资源。
TalkVisions是一款创新的移动应用,通过视频中的闭合字幕翻译,消除语言障碍。它利用先进的语音识别技术,实现实时的语言转录和翻译。用户可以选择所需的翻译语言,录制视频,等待应用程序转录并翻译所说的内容,最后保存带有翻译字幕的录制视频。
Immersive Translate支持多个视频平台的双语字幕功能,包括YouTube、Vimeo、Udemy、Netflix、Coursera、Bloomberg等,当前支持超过50个平台,并持续扩展。
Miraa 是一个强大的双语学习工具,可以将任何视频转录为双语字幕,提供实时翻译、跟读练习和AI驱动的解释,帮助用户更好地学习语言。
字幕翻译工具是一个免费的在线工具,用于在多种语言之间翻译字幕,支持多种文件格式。用户只需上传字幕文件,选择目标语言,点击翻译按钮,等待完成后即可下载翻译后的字幕文件。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型