Hibiki是由Kyutai Labs开发的实时流式语音翻译工具,旨在实现跨语言无缝交流。它支持边说边译,保留说话者音色,并适配多种设备。当前主要支持法语到英语的翻译,未来可能扩展到更多语言。
豆包同声传译模型基于豆包大模型的语音理解能力,提供高质量、低延迟的端到端同声翻译服务。它支持跨语言同音色翻译,并能识别粤语、上海话等方言,适用于会议翻译、线上直播等实时场景。项目通过火山引擎控制台或API使用,功能包括实时语音翻译和语音克隆,帮助用户在跨语言交流中保持语音的自然性和一致性。
Pinch Video Call 是一款提供沉浸式实时语音翻译的视频会议工具,支持超过30种语言的即时翻译,帮助用户跨越语言障碍,实现无缝沟通。它适用于视频会议和网络研讨会,特别适合全球团队会议、国际客户销售与支持、以及跨语言的教育和家庭交流等场景。
Multilingual Speak Sync 是一个实时语音聊天室,支持多语言即时翻译,帮助用户跨越语言障碍,实现无缝交流。用户可以自由选择语言,系统会实时将语音翻译成其他参与者的语言。
Llama3-S是一个扩展文本基础的大型语言模型,具备原生的‘听力’能力。通过早期融合模型训练,Llama3-S实现了声音识别与文本理解的有效结合,适用于多种语言处理任务。
Felo Translator是一款基于GPT-4.0的翻译应用,支持15种以上语言的即时高质量翻译,兼容Android和iOS系统,具备实时语音翻译功能,并支持自动备份翻译历史。
Whisper-V3 是最新的开放源代码语音识别模型,相较于 Whisper-V2 有了显著改进,能够将音频直接转换为文本,并支持多任务处理,适用于多种应用场景。
Meta 新推出的实时语音翻译模型 Seamless,能保持原声的表情和风格。该模型具备强大的语音生成和翻译能力,超越了现有的技术,提供自然流畅的多语言交流体验。
speakSync 是一款基于 ChatGPT 的 AI 语音翻译应用,支持超过 70 种语言,旨在促进面对面的语音交流。用户可以通过下载应用,点击按钮即可实时将语音翻译成所需语言,也可以通过输入文本快速进行翻译,适用于商务、旅行和教育等场景。
Interpre-X是一个基于网页的应用程序,提供10多种语言的实时语音翻译。该应用程序利用先进的人工智能技术,提供语音到语音、语音到文本、文本到语音和文本到文本的翻译,使用自然的人声质量和准确的口音,确保高质量的翻译体验。
SpeakShift是一个实时语音翻译平台,利用人工智能技术,帮助不同语言的人们无缝沟通。用户只需对着平台讲话,它就会实时翻译,使接收方能够理解,无论他们的母语是什么。此外,SpeakShift还提供视频配音服务,便于创建可以接触全球受众的多语言内容,并提供语言分析功能,实时获取内容中使用的语言洞察,帮助优化沟通策略。
anytalk.ai 是一个实时语音翻译平台,能够在视频会议中即时翻译语音,同时保留说话者的声音,使得任何人、任何时间都能轻松沟通。
Byrdhouse AI提供基于AI的实时语音和字幕翻译,支持100多种语言,适用于会议、培训及活动,旨在帮助不同语言使用者建立更深的信任和联系。
Articula是一款世界上最快和最准确的通话翻译应用,支持实时翻译24种语言的语音和视频通话。用户只需下载并安装应用,选择源语言和目标语言,通话中Articula将自动实时翻译对话,帮助用户与不同语言的人沟通。
Articula是一个AI翻译工具,可以实时翻译语音和视频通话,让用户以自己的声音进行交流,支持多种语言,具有低延迟特性。
Transluto是一个神经网络驱动的快速、准确和强大的语言翻译系统,旨在改变我们跨语言交流的方式。用户只需输入文本或上传文件,选择源语言和目标语言,然后点击“翻译”按钮即可获取翻译结果。
anyLanguage.ai 是一款针对网页浏览器的即时 AI 翻译扩展,能够在多种语言间无缝翻译,提升沟通和理解能力。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型