MIMO是阿里开源的可控角色视频生成模型,支持通过一张图片生成虚拟角色动画视频。该项目不仅能够根据用户提供的简单输入(如角色、动作和场景)合成逼真的角色视频,还能在统一框架中实现任意角色的高级可扩展性、对新颖3D动作的通用性以及对交互式现实场景的适用性。项目地址、论文和在线演示均已公开,用户可以通过GitHub获取代码并尝试使用。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型