一个超快速的语音识别工具,基于OpenAI的Whisper Large v3模型,能把长达5小时的音频在不到2分钟内转写成文字。
Vocal Remover是一个前沿的AI工具,旨在简化音频轨道的人声隔离过程,方便音乐制作人、DJ和卡拉OK爱好者创建伴奏或无伴奏版本。
Whisper for Large Audio 是一个简单的解决方案,旨在帮助用户处理大音频文件的转录问题。用户可以直接在浏览器中将任意大型音频文件分割,并利用 OpenAI 的 Whisper 对分割后的部分进行转录,只需一键即可获得完整的转录文本,消除了文件大小限制和手动操作的繁琐。
WAAS是一个平台,提供OpenAI的Whisper自动语音识别(ASR)系统的图形用户界面和API,用户可以通过直接访问API或使用提供的GUI接口进行音频文件的转录和管理。
article2audio是一个专注于网页内容的文本转语音应用,用户可以通过输入文章或博客的URL来生成音频,方便随时随地收听。
listen411.com是一个专注于播客内容的转录和摘要服务平台,旨在帮助用户快速获取音频文件的文字内容和关键信息,提升信息获取的效率。
Komandi是一个AI驱动的终端命令管理工具,旨在革新用户管理和执行命令的方式,大幅提升工作效率。它支持用户插入、收藏、复制和执行命令,同时能够识别并警告潜在的危险命令。
btw是一个基于OpenAI服务的命令行助手,专注于自然语言处理,用户可以通过简单的命令行交互来执行多种NLP任务,如文本生成和翻译等。它集成了OpenAI的强大API,提供了易于使用的界面,适合开发者和普通用户使用。
whisper-cli-rs是一个使用Rust编写的命令行工具,基于whisper.cpp,支持多种音频格式,实现实时语音转文本,并允许用户自定义模型选择。
ChatTTS Site是一个开源的文本转语音项目,旨在帮助用户快速入门。您可以学习如何在本地使用ChatTTS,使用我们的在线演示,以及将ChatTTS集成到您的项目中。
Video2Text 是一个基于 OpenAI Whisper 的网页服务,能够准确地将视频转换为文本,帮助研究人员、教育工作者、记者和内容创作者轻松进行视频转录。
useBase Web Extension for Chrome是一个官方扩展,允许用户直接从任何网页与useBase收藏进行交互。用户可以通过选择网页上的文本将数据发布到他们的收藏中,并通过简单的命令在输入区域中提取和分析数据。该扩展还包括切换明暗模式的选项。