该系统通过声音输入生成跨模态的3D面部模型,支持多种语音输入。
SchurVINS是一个基于Schur补的轻量级视觉惯性导航系统,旨在提供高效且准确的导航能力。
echomimic_v2 是 echomimic 的升级版本,从数字脸升级到数字人,支持通过输入图像、音频和手势生成高度逼真的数字人。该工具集成了音频处理和手势输入,增强了交互体验,适用于虚拟主播、虚拟助手、教育、娱乐等多种场景。
Analogenie是一个AI驱动的类比生成器,帮助作家通过生成上下文化的类比来增强他们的内容。它使用第三方cookie来个性化用户体验。
Block-Map-Based Localization使用块图技术,在大规模环境中实现高效定位,适合机器人导航与室内外定位系统。
该项目提出了一种在不同领域之间自适应的目标检测方法,旨在提高不同数据集上目标检测的准确性。它通过利用无标签数据的特性,帮助模型在缺乏标注数据的情况下进行有效训练。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型