Vidu 是由生数科技开发的 AI 视频生成平台,专注于将文字和图像转化为高质量的动态视频,同时保持主体一致性。它是国内首个纯自研的 AI 视频生成模型,适用于影视、动漫、广告和社交媒体内容创作等多种场景。Vidu1.5 是其重要升级版本,强调多主体一致性功能,生成速度快至 10 秒,分辨率最高达 1080P。
通义万象是阿里云推出的一款AI绘画大模型,支持文本生成图片、相似图片生成、图片风格迁移和视频生成。该项目旨在通过生成式AI技术支持多模态内容创作,特别适合企业用户在中国市场进行创意表达。目前处于beta测试阶段,完全免费,每天提供50点灵感值,每次生成成功扣除1点灵感值,每天零点重置。
Pippo是Meta Reality Labs推出的图像到视频生成模型,能够从单张照片生成1K分辨率的多视角高清人像视频。该模型基于多视角扩散变换器,预训练了30亿张人像图像,并在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块,用于注入像素对齐的条件,以及注意力偏差技术,能在推理时生成比训练时多5倍以上的视角。Pippo还引入了重投影误差,用于评估多视角生成的3D一致性。