Pippo是Meta Reality Labs推出的图像到视频生成模型,能够从单张照片生成1K分辨率的多视角高清人像视频。该模型基于多视角扩散变换器,预训练了30亿张人像图像,并在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块,用于注入像素对齐的条件,以及注意力偏差技术,能在推理时生成比训练时多5倍以上的视角。Pippo还引入了重投影误差,用于评估多视角生成的3D一致性。
SMPLX是一款基于深度学习的3D人体建模工具,能够生成高精度、可动画化的3D人物模型,适用于游戏开发、虚拟现实、动画制作等领域。它通过少量参数生成逼真的人体模型,支持精细的骨骼结构,具备面部表情和手部动作建模能力,大幅降低建模成本,提高制作效率。
cog-consistent-character是一个基于AI的开源模型,能够在保持角色一致性的同时,增加多样性。它结合了InstantID、IPAdapter、Controlnet和FaceDetailer等多种技术,全部由SDXL Lightning驱动。该工具支持在ComfyUI中直接使用工作流,简化角色图像的创作过程,适用于角色设计、动画制作、游戏开发等多种场景。
ControlNet是一款基于Stable Diffusion的AI图像生成模型,能够通过草图、深度图、姿态等多种方式精准控制AI绘画的细节。它提供了更高的可控性,使用户在保持创意自由度的同时,能够精准调整构图、光影和风格。ControlNet适用于概念设计、动画制作、虚拟形象创建等多种场景,是AI绘画领域的强大工具。
SadTalker是一款基于深度学习的图像驱动语音合成模型,能够让静态人物照片同步嘴型、头部动作,并生成与语音匹配的动态视频。通过3D人脸重建和运动预测技术,使人物表情更自然,嘴型对齐更加精准。无需复杂的动捕设备,仅需一张图片和一段语音即可生成高度逼真的动态视频。广泛应用于虚拟主播、动画制作、AI教育等领域,为AI内容创作带来更多可能性。
Rodin是一个网络应用,用户可以轻松创建和可视化3D模型,提供友好的界面,适合初学者和专业人士。用户可以探索虚拟环境、执行动画,并与他人分享创作,赋予用户在三维空间中实现创意的能力,拥有多种增强创造力和生产力的工具和功能。
Shapen是一个强大的工具,用户只需提供一张图片,即可生成高清晰度的3D模型,适用于动画、渲染和3D打印等多种用途。
Yellow是一个先进的AI工具,旨在改变3D建模领域,特别是在游戏和创意产业中。它通过整合尖端的3D AI技术与强大的创意工具,加速生产过程,使创作者能够创建更复杂和广泛的数字体验。
QuickMagic通过先进的AI技术革新了动作捕捉的方式,为动画师、游戏开发者和数字内容创作者提供简化且经济高效的解决方案。它能够实时准确地捕捉和分析人类运动,支持各种规模和复杂度的项目,并与多种动画和游戏开发软件兼容。
Story Diffusion AI 是一个前沿平台,结合了人工智能与创造力。用户可以利用先进的扩散模型,将他们的叙事转化为引人入胜的视觉故事,激发想象力,开启创作之旅。
Hypothetic是一个开创性的AI驱动平台,旨在彻底改变3D和2D资产的管理与协作,特别针对3D创作和游戏开发领域的专业人士。通过先进的AI技术,Hypothetic简化了复杂的3D文件管理流程,使团队更容易、更快速、更智能地协同工作,实现数字创作的梦想。
Meshcapade是一个前沿平台,专注于通过文本、视频和图像创建生动的数字人类,简化动画制作流程,主要面向游戏、动画和虚拟现实行业的专业人士。
腾讯推出的高分辨率3D资产生成工具,能通过图片或文字生成高质量的3D模型和纹理,让3D创作变得简单高效
MotionGPT通过微调大型语言模型(LLM)实现运动生成,专为游戏开发而设计,能够生成多种类型的运动动画,并支持实时生成,提升游戏及VR应用的体验。
VideoGigaGAN是一种视频超分辨率(VSR)方法,能够生成具有高频细节和时间一致性的视频,扩展自GigaGAN。该项目通过将视频放大8倍,显著提高上采样视频的时间一致性,确保生成的画面在细节和流畅度上都达到高标准。
MVDD利用多视角深度和扩散模型来表示复杂的三维形状,并将其映射到二维数据格式中。该模型能够生成高质量、密度较高的点云,包含细致的细节,点数可达20,000个以上。
i2vgen-xl是一个最新的开源视频生成模型,基于先进的深度学习技术,能够支持高质量视频生成,并且开放源代码,便于用户自定义和扩展。该模型可以处理多种输入格式,适用于多种应用场景。
LongAnimateDiff是Lightricks发布的一个基于AnimateDiff模型(v2)的高级运动模块,旨在解决Animatediff一次只能生成16帧视频的限制。它支持生成最多64帧的视频,超越了Stability AI SVD设定的25帧行业标准。该项目提供了更高的帧数生成能力,适用于需要高质量帧生成的动画项目,并且可以与ComfyUI集成,优化视频生成流程。
《人体运动扩散模型》的论文代码,旨在高效生成和编辑人体运动,支持多种运动风格和动作捕捉数据。
VoxCraft AI 是一个能够快速创建3D场景的工具,用户可以通过VoxCraft生成的模型节省设置时间。该平台支持用户在几秒钟内预览粗略的3D模型,并提供快速再生选项。用户能够在15分钟内精炼几何形状和纹理,以获得高质量的结果。
Soca AI是一个旨在民主化创意学习的平台,帮助个人成为数字教育者或创作者。用户可以通过注册网站,探索各种工具和资源,利用生成性AI语音和角色特性来增强他们的创意项目。
Moonvalley是一个突破性的文本转视频生成AI模型,可以从简单的文本提示中创建视觉上令人惊叹的高清晰度视频和动画,支持多种风格,包括超现实主义和动漫,使用先进的深度学习视频技术,用户只需输入文本提示,Moonvalley的机器学习模型将完成剩下的工作。
Wonder Studio是由Wonder Dynamics开发的一项革命性进展,特别是在将计算机生成(CG)角色集成到实景拍摄中的电影制作和动画领域。这款AI驱动的工具简化了曾经复杂且成本高昂的动画和合成过程,使其对电影制作者和内容创作者更加易于访问和高效。
Move AI是一种创新的运动捕捉技术,通过将2D视频转化为3D运动数据,利用先进的AI、计算机视觉、生物力学和物理学,简化了动画角色的运动捕捉过程,适用于从独立创作者到大型工作室的广泛用户。
GET3D是NVIDIA推出的前沿AI工具,通过生成对抗网络(GAN)实现高效的3D模型生成,适用于游戏开发、虚拟现实及建筑可视化等多个领域。
EbSynth是一款革命性AI工具,通过对单个画面的风格应用于整个视频序列,简化了动画制作过程,为艺术家和内容创作者提供了新的创作可能性。