DynamiCrafter是由香港中文大学、腾讯AI实验室和北京大学共同开发的项目,利用视频扩散先验技术将静态图像转换为动画。该项目支持多种主题和风格,如风景、人物、动物、交通工具、雕塑等,并且能够生成高分辨率、动态连贯的视频。DynamiCrafter还提供了生成帧插值和循环视频生成的功能,适用于多种应用场景,如故事讲述视频生成等。
ViViD是一个基于扩散模型的视频虚拟试穿技术项目,由中国科学技术大学和阿里巴巴集团联合开发。该项目旨在通过合成视频让消费者看到衣物穿在自己身上的真实效果,解决了传统基于图像的方法在视频中导致的时间不一致性问题。ViViD生成高质量的视频,保留了衣物的细节和质感,并构建了一个高分辨率、种类丰富的数据集,显著提升了模型的表现。项目支持多种服装类型,包括上身、下身和连衣裙,能够生成高分辨率的试穿视频,并具有较快的处理速度,适用于实时或近实时的应用场景。
MagicVideo-V2 是一款先进的视频生成工具,能够根据文本描述生成高分辨率视频,集成了多种高科技功能,实现视频内容的创作与编辑,适用于广告和营销领域。
Sora 是一个由 OpenAI 开发的AI模型,能够根据文本输入生成视频。它利用先进的机器学习技术理解和创建视觉上吸引人的视频,基于给定的描述,Sora 实现了动态视频创作,极大地便利了视频制作。
Clipchamp的文字转语音生成器
AI真人出镜视频讲解
Stable Audio Open是一个优化的开源模型,旨在使用文本提示生成短音频样本、音效和制作元素,能够从简单的文本输入创建最长47秒的高质量音频数据。
CapCut是一个由AI驱动的全能创意平台,支持在浏览器、Windows、Mac、Android和iOS上进行视频编辑和图像设计。用户可以通过浏览器在线访问CapCut,下载桌面应用程序进行离线编辑,或使用移动应用程序随时随地进行编辑。CapCut提供各种工具和功能,帮助用户裁剪、剪切和编辑视频,添加文本和字幕,融入音乐和音效,应用视频效果和滤镜,去除背景,提升图像和视频质量,并与团队成员协作。
TimeStamper是一个AI工具,通过输入YouTube视频链接,能够在不到15秒的时间内为长视频内容生成时间戳和章节,极大地节省了内容创作者的手动操作时间。
本项目旨在分享大模型相关技术原理以及实战经验,包括大模型工程化和应用落地,降低学习难度,促进技术普及。
TransferAttack是一个基于PyTorch的框架,旨在提升图像分类中的对抗性传递性,提供评估和攻击模型的功能,并对已有的传递性攻击进行分类和评估。
Free AI Apps是一个汇集了所有互联网免费AI应用程序的目录,旨在帮助用户轻松找到和访问各种免费的人工智能工具和应用,提供一个整合的平台,方便用户探索和利用AI技术。
大型视觉语言模型的海量多模态交叉理解基准测试,旨在评估模型在不同领域中的理解与生成能力,支持自动化的可靠度量。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型