腾讯开源的HunyanVideo-I2V是基于HunyanVideo框架开发的图像到视频生成模型,专注于从单张静态图片生成高质量动态视频(如跳舞视频)。它采用Transformer架构和全注意力机制,结合3D VAE技术压缩视频数据,支持通过文本提示指导动作生成。作为目前开源领域最大的视频生成模型之一(130亿参数),其目标是为开发者提供可定制化的视频生成工具,弥合闭源与开源模型的差距。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型