这是一个基于ByteDance的MegaTTS3模型的ComfyUI自定义节点,提供高质量的文本到语音合成功能,支持中英双语和语音克隆。 项目通过ComfyUI的工作流界面实现语音生成和克隆,支持参数调优、GPU资源优化和自动模型下载等功能。 用户可以通过提供简短的语音样本(WAV和NPY文件)克隆任何声音,并精细控制发音质量、语音相似度等参数。
ComfyUI_MegaTTS3是ComfyUI的一个插件,支持MegaTTS 3的高质量语音克隆功能,能够实现中英文的语音克隆,并支持跨语言克隆。用户需要手动下载模型和语音文件,并放置在指定目录中。项目提供了详细的安装指南和模型下载链接,方便用户快速上手使用。
ComfyUI-SUPIR是一个为ComfyUI设计的SUPIR图像放大封装器,能够将低分辨率图像放大到高分辨率,同时保持细节和真实感。它基于SUPIR模型,支持多种复杂的退化情况处理,如模糊、噪声、压缩等,实现高质量的图像复原。该工具可以作为ComfyUI的自定义节点,与其他节点组合,实现去噪、增强、风格迁移等功能。
ComfyUI Inpaint Nodes 是一个为 ComfyUI 设计的插件,专注于增强图像重绘和扩图功能。它支持多种重绘模型,如 Fooocus inpaint for SDXL、LaMa 和 MAT,适合处理图像中缺失或损坏的部分,比如移除物体或修复照片。插件提供了丰富的预处理和后处理工具,如扩展掩码、去噪到合成掩码等,帮助用户更高效地完成图像编辑任务。
该项目是一个由B站用户T8发布的ComfyUI插件部署教程,主要介绍如何在ComfyUI中部署一个支持生成NSFW(Not Safe For Work)内容的插件。该教程可能涉及如何突破ComfyUI的默认限制,允许生成不受NSFW过滤器约束的文字和图片内容。由于无法直接访问视频,具体细节尚不明确,但推测教程可能包括插件的下载、配置以及在工作流中使用相关节点的步骤。
ComfyUI-Allor 是一个专为图像处理设计的高性能 ComfyUI 插件,包含超过 90 个节点,每个节点都有丰富的参数供用户自定义。它支持透明度和多图像处理,所有操作均在张量空间中进行,避免了不必要的数据转换。插件完全可配置,允许用户禁用不需要的功能。通过 ComfyUI 的工作流,用户可以生成复杂的图像效果,包括文字生成、图像抠图、前景背景融合等。
ComfyUI-layerdiffuse 是一个基于 ComfyUI 的插件,旨在通过 LayerDiffusion 技术实现 AI 绘画中的图层生成功能。它支持生成前景(FG)和背景(BG)的分离图层,并提供多种工作流来处理图像的合成、提取和混合。该项目特别适用于需要生成免抠图的应用场景,开启了 AI 绘画的图层时代。
ComfyUI-FaceChain是一款基于ComfyUI的面部处理插件,提供面部检测、融合、分割等功能,旨在简化人物面部编辑过程,提高工作效率。它通过集成多种面部处理技术,帮助用户快速完成复杂的面部编辑任务。
ComfyUI_EchoMimic是一款集成EchoMimic功能的ComfyUI插件,能够实现逼真的音频驱动人像动画。通过可编辑的标志点调节,使动画更加生动自然,适用于视频制作、虚拟角色动画以及增强虚拟会议或直播中的角色表现。
ComfyUI-LG_HotReload是一个专为ComfyUI设计的插件,旨在实现代码修改后的实时热重载,从而显著提升开发效率。该插件通过智能监控、即时更新和防抖设计等功能,确保开发者在修改代码后无需重启ComfyUI即可实时查看效果,并优化资源使用,提升开发体验。
集成了 TeaCache 的 ComfyUI 插件,用于加速图像、视频和音频扩散模型的推理过程,支持多种模型,并提供了简单的安装方法和推荐配置
comfyui-shua-creator 是一个针对 ComfyUI 的插件,旨在方便用户创建和投稿有趣的工作流。它提供简单的安装流程,并集成了妙刷的创作者操作栏,用户可以直接在 ComfyUI 中进行工作流的投稿和管理。
FLUX 的 ID 保持项目PuLID现在已经有ComfyUI插件了,旨在增强用户在ComfyUI中的功能体验,提供更灵活的数据处理能力。
提供了 ComfyUI 的 BiRefNet 插件,支持多种预训练模型的使用,包括通用、人像、图像分割等场景的模型,并且支持自动下载模型文件。
ComfyUI_Bxb 是一款能够将 ComfyUI 工作流转换成小程序的开源插件,支持多种主流平台的小程序,并且可以实现支付变现,方便用户推广和商业化应用。
为 Segment-Anything 2 提供扩展功能的 ComfyUI 插件项目,支持自定义节点和模型下载,让图像和视频的分割任务变得更加便捷和高效
HunyuanVideo是腾讯开源的混元模型视频版本,旨在提供高效的视频处理和分析能力。该项目支持多种视频处理任务,并能够实时分析视频内容,适用于各种输入和输出格式。
Face26是一款创新的AI驱动照片增强器,旨在为旧照片、模糊图像或低质量照片注入新生命。它提供了多种工具,可以满足各种照片增强需求,如去模糊、为黑白照片上色、恢复老旧快照和为静态肖像动画化。用户界面友好,并结合强大的AI算法,Face26承诺将彻底改变我们与照片的互动方式。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型