MegaTTS3是字节跳动开源的轻量级语音合成系统,基于PyTorch实现,支持中英双语及代码切换。其核心采用仅0.45B参数的扩散Transformer模型,可实现高质量零样本语音克隆,并提供口音控制、细粒度发音调节等功能。项目包含语音对齐器、音素转换模型和WaveVAE编解码器等子模块,适用于学术研究及多场景语音合成需求。
无缝扩图是一个基于Flux1-fill-dev模型的图像扩展工具,专注于扩展图片内容并增强视觉效果。它适用于制作推进镜头效果,帮助用户实现更丰富的动态视觉效果。项目支持模型下载和与ComfyUI的集成,方便用户在AI图像生成工具中应用该工作流。
VACE是阿里开发的一体化视频创作和编辑模型,集成了多种先进技术,支持Wan和LTX模型的推理,并能够集成到ComfyUI中。该模型提供了丰富的视频编辑功能,能够对视频中的元素进行移动、替换、动态化处理,同时保持视频的内容、结构、主体和姿势。此外,VACE还支持视频重绘和画面扩展,为用户提供了全面的视频创作和编辑解决方案。
Playbook通过与ComfyUI的动态集成,彻底改变了3D场景创建,简化了渲染和管理3D工作流程的过程,适合创作者和专业人士。
Cheapcomfyui是一个完全托管的ComfyUI平台,旨在简化在云端的启动、作为无服务器API的部署以及配置游乐场。用户可以方便地使用该平台进行各种配置和操作,提升开发和使用体验。
用于使用 Genmo Mochi 编辑视频的 ComfyUI 节点,旨在通过类似 RF-Inversion 的策略,将视频逆转为噪声并使用目标提示重新采样视频。
用于在 ComfyUI 中运行 X-Portrait 的包装器,用于将视频中的人脸动画化,使其遵循参考图像的风格。该项目实现了视频人脸的动态效果与图像风格的匹配,提供了良好的用户体验,支持多种视频格式,方便用户在创作中进行个性化调整。
Flux是由Stability AI原来Stable diffusion的创始成员打造的生成图像项目,生成图像的质量与midjourney不相上下,甚至更好!
一款将MMAudio集成到ComfyUI的音频处理工具,旨在简化音频模型的加载和使用,提高音频编辑的便捷性和效率
ComfyUI-HunyuanVideoStyler是一个为视频生成增添经典电影场景风格的工具,通过引入经典电影场景的美学,使视频输出更具动态感和专业感。该工具能够与ComfyUI无缝集成,提供简单易用的自定义节点,方便用户实现个性化的视频风格。
Finegrain是一个抠图模型,支持通过提示词或框选主体进行抠图。用户可以灵活选择抠图方式,适用于各种图像处理场景,提供高质量的抠图效果,易于使用和集成。
Track Anything 是一个高效的目标跟踪项目,旨在实现视频中物体的准确跟踪与抠图,具有出色的实时性能和用户友好的界面。
FLUX 的 ID 保持项目PuLID现在已经有ComfyUI插件了,旨在增强用户在ComfyUI中的功能体验,提供更灵活的数据处理能力。
基于FLUX.1的IPAdapter模型的ComfyUI插件实现,支持通过参考图像来控制生成结果。该项目提供了完整的模型权重和工作流程,可在ComfyUI中快速部署使用,同时也支持在线体验版本。
Flask-FomanticUI是一个Flask扩展,旨在简化Fomantic-UI CSS框架的嵌入,提供便捷的组件使用和表单处理功能,同时支持自定义样式和主题,兼容Flask的所有特性。
Snapclear是一款支持Windows、macOS和Linux的AI驱动软件,能够离线自动去除图像背景或提升图像分辨率,为用户提供高质量照片。
typical-sampling 是一个为 Jax、PyTorch 和 TensorFlow 打造的先进自然语言处理工具,支持典型采样算法,旨在优化模型训练和推理过程,提供易于集成的 API 以提升开发效率。
一种基于生成扩散的高质量图像修复技术,可以从非常低质量的原图生成高清修复图。