Hallo3 是复旦大学与百度联合开源的高动态与真实感肖像动画生成框架,基于扩散变换器网络(Diffusion Transformer Networks),能够生成高度动态和逼真的视频。该项目支持处理非正面视角的肖像动画,渲染肖像周围的动态物体,生成沉浸式逼真背景,并具备强大的泛化能力。通过身份参考网络确保视频序列中的面部身份一致,支持语音音频驱动的连续视频生成。
基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成框架。
Loopy是一个能够利用长期运动依赖性生成自然运动模式的项目,仅通过音频生成生动的运动细节,支持多种视觉和音频风格,消除手动指定空间运动模板的需求,生成运动自适应的合成结果。
ChatAvatar是一个创新的平台,允许用户通过文本、照片或艺术作品在几分钟内生成可动画化的、符合生产标准的3D头像。该项目旨在简化3D头像的创建过程,使个人和企业能够快速获取高质量的数字化形象。
Studio Neiro AI 是一个生成视频头像的平台,可以创建出具有真实人类特征和微表情的虚拟角色,精准传达品牌脚本或音频演讲内容。用户可以自定义AI头像的声音,以匹配说话者的个性,适用于多种场景。
KeypointNeRF通过相对空间编码的关键点,生成多视角的体积化头像,适用于虚拟现实和游戏等领域。
Immersive Fox 是一款先进的 AI 文本转视频工具,旨在通过简单的文本输入在几分钟内生成吸引人的多语言视频,帮助企业提升营销和沟通策略。用户可以创建个性化的数字化身,简化视频制作过程,增强与受众的联系。
Astria是一个基于AI的平台,提供Dreambooth API,允许用户使用AI创建自定义图像。用户只需注册账户,便可在几分钟内开始使用,按照简单易懂的文档将API集成到应用程序或网站中。
Sadtalker AI是一种开源技术,旨在根据音频输入为静态图像进行动画处理,使图像生动起来,适用于各种场景,如社交媒体、教育和娱乐。
echomimic_v2 是 echomimic 的升级版本,从数字脸升级到数字人,支持通过输入图像、音频和手势生成高度逼真的数字人。该工具集成了音频处理和手势输入,增强了交互体验,适用于虚拟主播、虚拟助手、教育、娱乐等多种场景。
腾讯推出的高分辨率3D资产生成工具,能通过图片或文字生成高质量的3D模型和纹理,让3D创作变得简单高效
QuickMagic通过先进的AI技术革新了动作捕捉的方式,为动画师、游戏开发者和数字内容创作者提供简化且经济高效的解决方案。它能够实时准确地捕捉和分析人类运动,支持各种规模和复杂度的项目,并与多种动画和游戏开发软件兼容。
Text2Motion是一个生成式AI初创公司,通过文本提示创建3D骨骼动画,旨在革新游戏、电影和视觉特效的动画制作。用户只需输入描述性文本提示,即可几乎瞬时生成3D骨骼动画。
MagicAnimate 是一个基于扩散模型的框架,旨在通过一张照片和骨骼动画生成时间连贯的人像动画视频。它专注于提高时间连贯性、忠实地保留参考图像以及提升动画的真实感。项目提供了创新的外观编码器和视频融合技术,确保长视频动画的平滑过渡,并在 TikTok 舞蹈数据集上,视频真实度比基线提高了超过 38%。此外,MagicAnimate 还提供了 Gradio 演示,支持本地和在线测试。