标签:DiT架构

阿里云万相2.1开源:Flow Matching范式引领视频生成新潮流

阿里云宣布其视觉生成基座模型万相2.1开源,采用Apache2.0协议,支持文生视频和图生视频任务。万相2.1在多个评测中表现优异,超越了Sora、Luma、Pika等国内外...

万相2.1开源背后的技术革新:因果3D VAE如何重塑视频生成

阿里云开源视觉生成基座模型万相2.1,采用Apache2.0协议,支持文生视频和图生视频任务。万相2.1基于DiT架构和线性噪声轨迹Flow Matching范式,通过因果3D VAE...

阿里巴巴开源万相2.1模型:开启视频生成新纪元

阿里巴巴宣布全面开源其视频生成模型万相2.1,基于Apache2.0协议,支持文生视频和图生视频任务。该模型通过自研的高效VAE和DiT架构增强了时空上下文建模能力...