Gradio交互界面

PromptDepthAnything开源项目 – 高分辨率深度估计神器

PromptDepthAnything开源项目 – 高分辨率深度估计神器

PromptDepthAnything是一款专注于高分辨率深度估计的AI工具，能够轻松生成4K分辨率的深度图。通过Rerun可视化技术，用户可以更直观地查看深度图，同时提供Gradio交互界面，使得操作更加简单易上手。

AI生成深度图Gradio交互界面Rerun可视化高分辨率深度估计

SkyReels-V1开源项目 – 以人为中心的电影级视频生成模型

SkyReels-V1开源项目 – 以人为中心的电影级视频生成模型

SkyReels-V1是昆仑万维开源的首个以人为中心的视频生成模型，具备电影级画质，支持多种面部表情和自然动作组合。该模型使用好莱坞级影视数据进行训练，具有专业的构图和摄影效果，并采用自研的数据清洗和标注流程。它能够处理多人场景中的空间关系，支持文本生成视频(T2V)和图像生成视频(I2V)，并且支持多GPU推理和用户级GPU部署。

Gradio交互界面Transformer架构开源项目静态照片动画生成

FunClip开源项目 – 精准、方便的视频切片工具

FunClip开源项目 – 精准、方便的视频切片工具

FunClip是一款完全开源、本地部署的自动化视频剪辑工具，能够通过大语言模型进行精准的视频切片。它集成了多种大语言模型的调用方式，并提供了prompt配置接口，具备优越的中文ASR识别效果，支持时间戳预测和热词定制化功能，允许用户根据说话人ID进行裁剪，使用Gradio交互界面实现简单易用。

Gradio交互界面中文ASR识别开源视频切片工具热词定制化

Clipchamp AI旁白生成器官网

Clipchamp的文字转语音生成器

AI视频工具AI音频工具

AutoCaption官网 – 智能视频字幕生成工具

AutoCaption是一款AI字幕生成器，可以为Instagram、TikTok和YouTube上的视频提供自动转录和动态表情符号。用户只需上传视频，AI便会自动生成字幕，且可自定义动画、字体、颜色，并添加动态表情符号。

AI字幕生成器动态字幕自定义自动转录工具视频内容创作

YouTube-Summarizer with GPT-4官网 – 快速视频摘要工具

YouTube-Summarizer是AzenAI套件的一部分，利用GPT-4技术，提供免费且快速的视频摘要服务，只需30秒便可提取视频中的关键洞见，适用于教程、博客等多种类型的视频，帮助用户高效消费内容。

GPT-4视频摘要YouTube视频摘要工具快速视频摘要服务高效内容消费

Local File Organizer开源项目 – 一款实用的 AI 文件整理器

Local File Organizer开源项目 – 一款实用的 AI 文件整理器

一款实用的 AI 文件整理器，通过扫描指定目录中的文件，理解文件内容并生成相关描述和文件夹名称，将文件整理到新目录结构中。

AI文件整理器多操作系统支持智能元数据生成自动文件分类

Build Social Skills with AI Voice Dates官网 – 利用AI提升社交自信

通过与AI进行语音对话，帮助用户练习社交技能，获得个性化反馈，从而提高口语能力和自信心。大多数人每天说话时间不足10分钟，而Rizz AI提供的对话练习可以有效改善这一现状。

AI语音对话练习个性化反馈口语能力训练社交技能提升

Text To Audio—TTS &MP3_WAV官网 – 自定义语音生成工具

Text To Audio—TTS & MP3_WAV 是一款文本转语音工具，用户可以通过调整语音的速度和音调来创建个性化的声音。

故事讲述教学视频旁白文本转语音工具自定义语音生成

Spakfly官网 – 将文本转化为自然人声的语音软件

Spakfly是一款能够将任何文本转换为100%人声的语音软件，适用于视频销售信、教育视频、营销视频、培训视频、有声书等多种场景。用户只需注册账号，选择语言和声音，输入文本，定制语音设置，然后生成并下载语音文件。

在线内容创作教育视频文本转语音软件有声书

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3