标签:视频生成

Sora:OpenAI引领AI视频生成新纪元

OpenAI最新发布的Sora模型以其强大的文字转视频能力引发广泛关注。本文深入探讨Sora的技术特点、应用场景及其对AI领域的深远影响,同时分析OpenAI在AGI道路上...

人工智能新纪元:Wan2.1模型引领视频生成技术革命

阿里巴巴通义实验室开源了最新视频生成模型Wan2.1系列,凭借3D变分自编码器、视频扩散DiT等核心技术,实现了复杂运动、物理模拟、电影质感等突破性进展,为AI...

英伟达Cosmos:扩散模型驱动的物理AI革命

英伟达最新发布的Cosmos世界基础模型,结合扩散模型、自回归模型和分词器技术,能够模拟物理世界并生成高分辨率视频。该模型在机器人训练、自动驾驶和合成数...

阿里万相2.1大模型开源引爆全球,登顶Hugging Face双榜

阿里云开源的万相2.1大模型在短短6天内迅速登顶Hugging Face模型热榜和模型空间榜,成为全球开源社区最受欢迎的模型。其14B和1.3B版本在视频生成任务中表现卓...

万相2.1开源背后的技术革新:因果3D VAE如何重塑视频生成

阿里云开源视觉生成基座模型万相2.1,采用Apache2.0协议,支持文生视频和图生视频任务。万相2.1基于DiT架构和线性噪声轨迹Flow Matching范式,通过因果3D VAE...

阿里巴巴开源视频生成模型 Wan2.1:技术领先,开发者福音

阿里巴巴宣布全面开源其视频生成模型 Wan2.1,该模型在 VBench 测评中表现优异,总分高达 86.22%。开源内容包括 14B 和 1.3B 两个参数规格的推理代码和权重,...

阿里云开源万相2.1:中国AI技术的全球突围

阿里云开源视觉生成基座模型万相2.1,以86.22%的评测成绩超越国际竞品,展示了中国AI技术的全球竞争力。文章探讨了万相2.1的技术优势、开源战略及其对全球AI...

阿里Tora:视频生成技术的创新突破与未来展望

阿里团队最新推出的视频生成框架Tora,通过轨迹导向的扩散变换器技术,实现了对物体运动轨迹的精准控制。本文将深入解析Tora的技术架构、创新亮点及其在电影...

多模态AI新突破:CogVideoX引领视频生成新时代

近期,多模态AI领域迎来多项重大突破。智谱AI开源了视频生成模型CogVideoX,支持单张4090显卡推理,标志着视频生成技术的又一里程碑。与此同时,斯坦福大学和...

时空补丁技术:Sora如何引领视频生成的新时代

本文探讨了OpenAI推出的Sora模型如何利用时空补丁技术革新视频生成领域。通过分析其核心技术、优势与局限性,文章揭示了Sora对行业的影响以及未来发展的潜力...
1 2 3