无障碍访问

Talk-to-ChatGPT官网 – 通过语音与ChatGPT交互

Talk-to-ChatGPT是一个Google Chrome扩展，允许用户通过语音命令与ChatGPT AI互动，并接收语音回复。用户只需安装扩展并激活麦克风，就可以开始提问或与AI进行对话，同时通过文本转语音功能收听AI的回复。

ChatGPT扩展无障碍访问语音交互语音命令

GPTOnCall官网 – 智能电话对话服务

GPTOnCall是一个由AI驱动的电话对话服务，通过聊天机器人提供即时答案、建议等，彻底改变了沟通方式，使用户能够获得电话上的AI助手支持。

AI驱动的电话对话服务多任务环境支持实时信息获取无障碍访问

SoundHound官网 – 一个为语音驱动的世界提供对话智能解决方案的平台

SoundHound是一个语音AI平台，提供语音驱动设备、服务、车辆和移动应用的对话智能解决方案。它可以集成到各个行业和用例中，帮助用户构建自己的语音助手，访问内容领域。

对话智能解决方案无障碍访问智能代理助手自定义语音助手

AI Voice Chat开源项目 – 语音交互AI助手

AI Voice Chat开源项目 – 语音交互AI助手

AI Voice Chat是一个基于React的语音交互应用，结合了Whisper Large v3、openchat 3.5 AWQ和XTTS v2技术，支持低延迟的语音对语音交互。项目在单个RTX 3090 GPU上运行，显存占用33G，比ChatGPT语音演示视频的延迟减少了一半以上。它能够高效地进行语音识别和合成，支持多种语言和方言，适用于实时语音聊天、客服机器人、智能家居设备、教育平台等多种场景。

低延迟语音交互多语言支持客服机器人集成教育培训

Vocode开源项目 – 轻松构建基于语音的LLM应用程序

Vocode开源项目 – 轻松构建基于语音的LLM应用程序

Vocode是一个让用户能够轻松构建基于语音的LLM应用程序的工具。它支持实时流式对话，可以将应用程序部署到电话呼叫、Zoom会议等多种场景中。同时，它也适合构建个人助手或类似基于语音的棋类应用，具备模块化设计，便于扩展，且为开源项目，受益于社区的不断发展。

实时语音交互开源语音应用语音助手构建工具语音游戏开发

SiteAgent官网 – 提升在线客户互动的AI解决方案

SiteAgent是一个结合了聊天机器人简便性和AI智能的在线客户互动平台，提供24/7支持，帮助用户快速找到产品和答案。通过AI语音互动，SiteAgent能够增强网站的客户体验和销售能力。

24小时客户支持AI语音助手在线客户互动平台客户满意度提升

Kokoro 82M官网 – 高质量的文本转语音模型

Kokoro 82M 是一个高质量的 TTS 模型，能够生成极高音频质量的语音，同时模型大小不到 300M，便于部署和使用。该模型在 T4 上能够快速生成语音，并支持通过架构训练其他语言，且只需不到 100 小时的音频数据进行训练。

Hugging Face演示TTS模型语音合成高质量文本转语音模型

Falcon-40B官网 – 号称目前最强的开放式LLM

由TII（Technology Innovation Institute）构建的一个40B参数的因果解码器模型，训练在精选语料库增强的1000B tokens的RefinedWeb上。

Falcon-40B内容创作对话系统开放式LLM

Babylon Voice – AI Voice GPT and VoiceID-基于语音的智能应用

Babylon Voice 是一个基于语音识别技术的网络应用，用户可以通过语音命令与其功能进行交互，提升工作效率，并增强无障碍体验。

提高工作效率无障碍体验语音识别技术语音驱动应用

RevComm官网 – AI驱动的智能IP电话

RevComm是一款AI驱动的IP电话，提供语音对话分析和智能PBX功能，旨在提高销售业绩、减少培训时间，并支持远程办公。

AI驱动的IP电话CRM集成数据分析智能PBX

Uberduck官网 – AI合成音乐人声的创新工具

Uberduck是一个创新的AI工具，专注于合成音乐和音频项目中的人声。它为音乐人、制作人和开发者提供多种功能，旨在简化将AI生成的声音集成到各种项目中的过程。

AI合成音乐人声工具AI生成歌曲声音克隆文本转语音API

ChatGPT Deutsch官网 – 德国领先的AI聊天机器人

ChatGPT Deutsch是德国人工智能领域的领先公司，主导着聊天机器人市场，致力于提供高效、智能的对话解决方案。

在线教育辅导客户服务自动化社交媒体互动聊天机器人

Nuance官网 – 先进的对话AI解决方案

Nuance是一家在人工智能领域的先驱，提供先进的对话AI解决方案，旨在通过AI驱动的工具提升医疗、客户服务等多个行业的效率与用户体验。

医疗AI工具客户服务AI对话AI解决方案生物识别安全

AI Clone Voice Free官网 – 快速生成高质量人声克隆

AI Clone Voice Free 是一个在线工具，可以在几秒钟内创建高质量的人声克隆。用户无需特殊设备，只需在浏览器中操作即可轻松实现语音克隆。该项目旨在为用户提供便捷的语音合成体验，适用于各种应用场景。

在线语音克隆工具语言学习辅助语音助手开发语音合成应用

fairseq开源项目 – 用于多种序列建模的开源工具包

fairseq开源项目 – 用于多种序列建模的开源工具包

fairseq是一个用于序列建模的开源工具包，支持多种自然语言处理和语音处理任务。

fairseq对话系统序列建模文本生成

Poly ai官网 – 客户主导的语音助手平台

PolyAI是一个提供客户主导语音助手的平台，帮助企业持续提供最佳品牌体验，实现准确解决方案，并发掘数据驱动的商业机会。

多语言支持定制化语音助手客户主导语音助手数据驱动的业务洞察

Cartesia Sonic官网 – 快速、真实的生成语音API

Cartesia Sonic是一个极其快速的生成语音API，具有135毫秒的模型延迟。它可以帮助用户构建高质量、实时的语音体验，提供多样的声音库、即时语音克隆、语音混合和语音设计，支持速度和情感控制。

实时语音体验播客教育应用有声书

enterprisebot.ai官网 – 为企业提供对话自动化解决方案

enterprisebot.ai是一个基于大型语言模型（如ChatGPT）的对话AI机器人，旨在通过公司数据改进客户和员工支持。它为多个行业提供定制化的解决方案，帮助企业提升服务效率和用户体验。

IT服务管理企业客户支持定制化解决方案对话AI机器人

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3