智谱刚发布的最新CogVideoX1.5模型,能够生成高质量的视频内容,支持多种分辨率及时长的视频生成。
Allegro是一个新的开源视频生成模型,能够支持多种内容的创建,包括人类和动物的特写镜头,以及各种动态场景。该模型可以生成720x1280分辨率、15 FPS的详细6秒视频,并支持使用EMA-VFI技术将帧率提高到30 FPS。Allegro具有175M参数的VideoVAE和2.8B参数的VideoDiT模型,能够在BF16模式下使用9.3 GB的显存,且上下文长度达到79.2k,相当于88帧。
Open-Sora-Plan 是由北京大学YuanGroup团队与北大-兔展AIGC联合实验室共同发起的项目,旨在复现OpenAI的Sora模型。该项目结合了视频VQ-VAE、Denoising Diffusion Transformer等技术,支持可变长宽比、分辨率和持续时间的视频生成。项目还提供了高质量的数据清洗策略、提示精炼器等功能,以增强对联合时空特征的捕获,并应用于创意短片生成、学术研究等领域。
Reemix是一个革命性的短视频创作平台,结合了尖端AI技术与无限创意,支持用户将文本转化为引人入胜的个性化视频,适用于各种场景,如喜剧、教育、生活方式等。
BlinkShot是一个实时AI图像生成器,能够快速生成高质量的图像,支持自定义分辨率和生成步骤,适合艺术创作和设计领域。
Tavus 是一款利用 AI 技术生成个性化视频的工具,可以为每个接收者创造独特的视频,使用用户的声音和面容,无需录制或使用机器人声音和库存面孔,轻松实现大规模视频生成。
Deforum 是一款基于稳定扩散技术的AI视频生成器,可以快速将你的照片转换为视频。用户只需上传照片,选择模板,即可让我们的AI和稳定扩散技术为您创建视频。
Open-Sora 是全球首个开源的类Sora架构视频生成模型,整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。它能够生成繁华都市夜景中的车水马龙,成本直降46%的Sora训练推理复现流程,并提供详细的上手教程和技术方案。Open-Sora 适用于生成高质量的视频内容,研究和复现Sora架构的技术细节,教育和学习视频生成模型的训练流程,以及开发社区的技术交流和分享。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型