INFP 是由 ByteDance 开发的音频驱动的双边互动视频生成框架,主要用于实时生成自然灵活的互动视频。它能够根据音频内容自动切换角色,生成与音频高度一致的面部表情和头部动作。该框架经过深度优化,运行速度超过 40 FPS,支持实时视频生成,适用于即时通讯、视频会议等实时场景。此外,它还支持多语言音频生成、唱歌模式,以及侧面头像和非人类形象的生成。
Text2Listen项目旨在让大语言模型能够理解人类语言,并做出合适的面部表情和动作,从而增强与用户的互动体验。该项目通过分析说话者的语音内容,生成对应的面部反应,并使用VQ-VAE技术对面部手势进行量化,确保生成的听众动作流畅且准确反映语言语义。此外,项目还将复杂的手势分解为简单的基础元素,从而提升聊天机器人的自然对话体验。
Gemsouls是一个人工智能平台,能够赋予虚拟角色生命,并将它们与真实世界连接。用户可以与喜爱的角色互动,创作者可以将虚构生物变为现实,同时在虚拟和现实之间建立持久的联系。
Tactile DreamFusion项目利用触觉传感器进行三维生成,旨在增强虚拟现实和机器人技术中的环境感知能力。该项目通过高效的三维重建技术,使得触觉反馈的生成成为可能,进而实现更加真实和互动的体验。
Snake-SLAM是一个可扩展的可视化惯性SLAM系统,专为低功耗航空设备设计,能够有效融合视觉和惯性传感器数据,实现实时导航和定位。
Chat With Anime是一个提供真实感语音的互动网站,用户可以与AI驱动的动漫角色进行动态对话,特别适合语言学习、互动故事和虚拟游戏。
HandDiff是一种利用扩散模型进行3D手势估计的方法,结合图像和点云数据,实现精确的手势识别和追踪。该项目致力于提升虚拟现实和增强现实中的人机交互体验。
SchurVINS是一个基于Schur补的轻量级视觉惯性导航系统,旨在提供高效且准确的导航能力。
Kazava是一个由AI驱动的技术平台,提供引人入胜和沉浸式的互动体验。用户可通过注册网站来探索各种功能,适用于虚拟现实游戏、互动故事讲述、教育培训及虚拟会议等场景。
Notevibes是一款先进的文本转语音AI工具,能够将书面文本即时转换为自然的语音,支持多种语言和丰富的声音选择,适用于内容创作者、教育工作者和商业专业人士等多种用户。
Leprechaun AI 是一款AI角色扮演游戏,玩家可以自由选择角色、获取物品和执行各种动作,真正实现想象力的无限可能。
Mondial3D是一个顶级工作室和市场,供3D设计师创建和展示作品,配备AI增强插件,丰富XR和元宇宙的创作过程。
AgentStore是一个提供AI驱动的可定制漫画伙伴的平台,用户可以与来自《鬼灭之刃》和《我的英雄学院》等热门系列的角色进行互动。通过'Commander Mode',用户可以自定义角色的语调、风格和头像。该平台基于GPT-3.5技术,具备独特的LLM引擎以及NSFW选项,带来前所未有的聊天体验。