Whisper-V3 是最新的开放源代码语音识别模型,相较于 Whisper-V2 有了显著改进,能够将音频直接转换为文本,并支持多任务处理,适用于多种应用场景。
Audioflare是一个基于Cloudflare AI Workers的全能音频平台,能够转录、分析、摘要和翻译任何音频文件。
Transkriptor是一个基于先进AI技术的在线转录软件,可以快速自动地将音频和视频转换为文本,适用于会议、访谈、讲座等场景,支持100多种语言,具备多种导出选项和多说话人识别功能,且易于使用。
Transcribo是一个WhatsApp机器人,可以将冗长的语音消息转录为文本、翻译和总结。只需将音频消息转发给该聊天机器人,即可快速获取所需信息,从而彻底改变您的聊天体验。
Articula是一款世界上最快和最准确的通话翻译应用,支持实时翻译24种语言的语音和视频通话。用户只需下载并安装应用,选择源语言和目标语言,通话中Articula将自动实时翻译对话,帮助用户与不同语言的人沟通。
UniGPT是一个整合了领先AI模型(如ChatGPT、Gemini和Claude)的全能AI平台,提供友好的用户界面,支持黑暗模式、流媒体、跨模态聊天和多语言功能。用户可以免费注册,体验先进的AI技术。
免费无限音频、视频转文本转录工具允许用户无限制地将音频和视频文件转换为文本,提供快速准确的转录服务。用户只需上传音频或视频文件,即可轻松获取文本内容,支持无限次使用。
ecango.com 是一个基于人工智能的音频和视频转录工具,用户可以轻松上传或拖放音频或视频文件,系统会自动生成转录文本,并支持导出为多种格式。
Happy Scribe是一种自动化和人工转录服务,能够高精度地将多种语言和格式的音频转换为文本。用户可以选择自动或人工转录,并能够方便地编辑、导出最终的转录文本或字幕。
aiwriter.fi是一个使用先进的OpenAI人工智能技术生成各种文本内容的平台,支持33种语言,能够生成文章、博客、广告等,还能利用DALL-E生成AI图像。
Text2Audio是一个简单的在线文本转语音(TTS)工具,可以将文本生成MP3音频文件。用户可以直接在网页中播放或下载音频文件。只需输入或粘贴希望听的文本,Text2Audio就会为您朗读。
SpeechPulse是一个利用计算机麦克风进行实时语音识别的应用程序,可以将语音转换为文本,支持在文本编辑器、网页浏览器和办公应用中输入,同时还可以转录音频/视频文件并生成字幕。
Akkadu是一个实时AI字幕工具,帮助用户以自己的语言轻松理解视频、网络研讨会、视频会议和直播,支持90多种语言,并兼容多种平台。
ABox是一款多功能的语音转换应用,旨在保护隐私,帮助声带受损的个人恢复自信,并让性别多样化的人士自由表达自己。
whisper-cpp-python是whisper.cpp的Python绑定,提供高效的语音识别功能,支持多种音频格式,具有简单易用的API和多线程处理能力。
SwiftWhisper是基于Whisper.cpp二次封装后,让Swift方便调用的库,基于它可以方便的开发语音识别转文字类的Whisper应用。
Sync Labs是一个API,允许用户将任何视频与任意语言的音频进行实时口型同步,无需训练即可实现视觉配音。