Talk是一个基于whisper.cpp和llama.cpp的项目,旨在实现与计算机的直接语音对话。它整合了先进的语音识别和生成技术,支持自然语言处理,能够实时响应用户的语音指令,并提供用户友好的界面,方便易用。
这个项目可以让用户与大语言模型进行自然的语音对话,结合先进的语音转录和文本到语音技术,提供流畅的交互体验。
Voicefy是一个直观的平台,可以将文本转换为逼真的语音,提供多种语言和声音,以最大化内容的可访问性和互动性。用户只需将文本输入框中,选择所需的语言和声音,点击‘转换’按钮生成语音,然后点击‘播放’按钮收听语音,此外,还可以将语音下载为音频文件。
实时创建、自定义和与您的 AI 角色/同伴交谈(全部在一个代码库中!使用LLM OpenAI GPT3.5 / 4,Anthropic Claude2,Chroma Vector DB,Whisper Speech2Text,ElevenLabs Text2Speech)
IBM Watson文字转语音
MindWrite AI是一个全面的AI生成平台,旨在通过自动化内容创作、代码生成、语音合成等,提升专业人士的工作效率和创造力。
Speechelo 是一款创新的 AI 文本转语音转换器,能够轻松将书面文本转化为自然逼真的声音,适用于各种应用场景。用户只需点击三下,即可生成与人类声音无异的语音。
Fithex AI是一款全方位的AI内容生成工具,能够轻松创建市场营销文案,尤其是完整的博客文章。它提供超过70种AI模板,可以在几秒钟内生成内容,此外还具有文本转语音和AI聊天机器人的功能。用户可以选择模板,撰写提示或上下文,个性化输出,使用Fithex编辑器编辑、润色和发布内容,最后将工作复制粘贴到内容管理系统中发布。
GPTSidekick是一个由GPT-4和Claude 3驱动的AI助手,提供多种功能,适合内容创作、研究辅助、语言翻译和数据分析等需求。用户可以通过简单的注册流程,选择合适的套餐,便捷地访问其强大的功能。
toVoice是一个终极平台,提供文本转语音、网页内容抓取和自动翻译的服务,用户可以将博客文章、文章和脚本转化为引人入胜的音频和视频,支持可定制的语音和多语言。该平台还提供先进的脚本编辑器和AI助手,简化内容创作过程。
BFF AI是一个全能平台,旨在帮助用户释放创造力并提升生产力。它结合了智能写作助手、图像生成器、语音转文本、文本转语音和AI代码生成器,重新定义了可能性。
SpeechKit 是一个平台,用户可以将文本转换为引人入胜的音频,提供一体化的音频内容管理系统(CMS)和 AI 语音,提升出版工作流程。用户只需将文本输入平台,并选择多种 AI 语音,即可将文本转换为高质量音频,并通过集成的 CMS 管理音频内容。
04-x是一个以隐私为首的聊天平台,支持多种语言模型,包括GPT-4、ChatGPT、DALL·E 3、Claude 2、Claude Instant、Cohere Chat、Llama 2,以及通过Ollama提供的其他开源模型。
集成了多模态动作模型的智能系统,通过思维链和前瞻性空间推理来执行具体动作,让机器人更智能地理解和完成任务
PollySpeak 是一款文本转语音应用,帮助用户克服干扰,提高无障碍性并提升阅读速度。通过逼真的声音,让用户在通勤、锻炼或多任务处理时听书,扫描文件中的文本并转换为音频,同时还能将网页内容转化为语音,是一款极具性价比的应用,且在网络中断时仍能使用。
Dubbing AI 是一款基于 AI 技术的语音变换工具,用户可以实时将自己的声音转换为其他人的声音,适用于各种场景,操作简单,且免费提供服务。