跨网络服务调用

RealtimeSTT_LLM_TTS开源项目 – 智谱AI驱动的实时语音处理工具

RealtimeSTT_LLM_TTS开源项目 – 智谱AI驱动的实时语音处理工具

RealtimeSTT_LLM_TTS是一个结合流式大型语言模型和GPT-SOVITS的工具，支持实时语音转文字和语音合成，能够通过网页实现跨网络服务调用，方便用户在不同场景中进行高效的语音交互。

AI驱动的语音处理工具实时语音转文字语音合成跨网络服务调用

OpenGPT.com官网 – 先进的AI解决方案平台

OpenGPT是一个创新的平台，提供先进的AI解决方案，包含最新的AI技术应用和更新的博客，是AI爱好者和专业人士获取前沿见解和工具的中心。用户可以通过注册网站，探索GPT商店、OpenChat和OpenDraw等多种产品，加入不断壮大的技术爱好者社区，体验基于AI的解决方案和创意。

AI解决方案平台个性化学习健身教练创意写作

Wispr Flow官网 – 语音驱动的快速写作工具

Wispr Flow 是一款语音驱动的听写工具，帮助用户在所有应用中以三倍的速度写作。用户可以自然地说话，Wispr Flow 将语音转换为完美格式化的文本，并具备实时自动编辑、语调匹配以及支持超过100种语言的功能。无论是撰写电子邮件、报告还是编程，Wispr Flow 都能节省时间并消除手动编辑，让工作流程更加顺畅和高效。

多语言支持实时自动编辑提高写作效率语音驱动写作工具

Whisper开源项目 – OpenAI的语音识别模型

Whisper开源项目 – OpenAI的语音识别模型

Whisper是OpenAI推出的强大语音识别模型，支持多语言语音转文本，能够高精度地识别口语、方言，并自动生成字幕。它采用Transformer架构，具备强大的抗噪能力，适用于视频字幕生成、语音助手、会议记录等场景。Whisper支持99种语言的语音-文本转换，在低资源语种识别任务中WER降低至7.3%，流式处理架构实现200ms端到端延迟，自监督预训练机制减少对标注数据的依赖。

多语言支持实时转写本地部署语音助手

eRPC开源项目 – 高效、可扩展的RPC框架

eRPC开源项目 – 高效、可扩展的RPC框架

eRPC 是一个高效、可扩展且简单易用的 RPC 框架。适用于 RPC、微服务、点对点长连接、IM 和游戏等领域。

即时通讯应用可扩展RPC微服务通信游戏服务器通信

VOMO官网 – 将声音转化为有序笔记的AI工具

VOMO是一个AI驱动的工具，允许用户将语音转换为有序的书面笔记，并轻松将其转换为幻灯片、表格、会议记录等多种格式。只需对着应用程序或网页界面说话，AI技术即可实时转录您的语音，帮助用户提高工作效率和创造力，减少输入时间。

AI会议记录幻灯片生成工具语音转文本工具高效笔记应用

MindWrite AI官网 – 颠覆内容创作的全能AI平台

MindWrite AI是一个全面的AI生成平台，旨在通过自动化内容创作、代码生成、语音合成等，提升专业人士的工作效率和创造力。

AI代码生成器AI内容生成器AI图像生成器SEO内容优化

OuteTTS开源项目 – 实验性的文本到语音模型

OuteTTS开源项目 – 实验性的文本到语音模型

OuteTTS是一个实验性的文本到语音模型，采用纯语言建模方法生成语音，致力于提升语音合成的自然性和可控性。

文本到语音模型用户自定义声音自然语言处理语音合成

whisper-jax开源项目 – 高效的多语言语音转文字模型

whisper-jax开源项目 – 高效的多语言语音转文字模型

一个快速且高效的语音转文字（STT）模型，支持多语言自动识别和翻译功能。

多语言自动识别实时语音服务语音翻译语音转文字模型

Wenet STT Python开源项目 – 基于WeNet的Python语音识别库

Wenet STT Python开源项目 – 基于WeNet的Python语音识别库

Wenet STT Python是一个基于WeNet的语音识别库，旨在提供高效、准确的语音转文本功能。它支持多种语言，能够实时处理语音输入，并允许用户自定义模型以满足特定需求，易于与现有Python项目集成。

Python语音转文本实时语音识别自定义模型语音识别库

ProtoReplicant开源项目 – 浏览器中的AI 3D化身语音接口

ProtoReplicant开源项目 – 浏览器中的AI 3D化身语音接口

ProtoReplicant是一个在浏览器中实现的AI 3D化身语音接口，集成了语音活动检测、语音转文本、大语言模型、文本转语音和虚拟角色模型等技术，旨在提供一种互动性强的用户体验。

AI 3D化身大语言模型文本转语音虚拟角色模型

FixMeBot官网 – AI语言助手，助你纠正文本

FixMeBot是一个基于AI的语言助手，帮助用户纠正文本、重述句子和翻译内容。它采用先进的AI算法提供准确的建议和修正，确保书面沟通无懈可击。用户可以通过Telegram与机器人聊天，根据需要选择适合的订阅计划，发送文本或语音消息，机器人将即时提供建议和修正，帮助用户提升文本质量。

AI语言助手多语言翻译文本纠正语音转文本

Cliptics官网 – 将文本转化为逼真的语音

Cliptics 是一个在线文本转语音服务，可以将文本转换为自然流畅的语音，提供无缝的用户体验。用户只需输入文本，选择语音，然后点击“生成语音”按钮即可将文本转换为语音。同时，用户可以根据个人喜好自定义语言和口音。

多语言支持播客制作文本转语音服务自然语音生成

Voicemod官网

Voicemod是一个全面的、由AI驱动的工具，旨在为使用Windows和macOS平台的游戏玩家和内容创作者等广泛用户群体提升音频体验。这款多功能软件允许用户实时修改和转换他们的声音，提供了一系列功能和优势，显著增强了在线互动和内容创作的体验。

AI驱动的音频工具内容创作工具实时声音修改游戏音频增强

rustdesk开源项目 – 开源的远程桌面软件

rustdesk开源项目 – 开源的远程桌面软件

Rustdesk 是一款面向所有人的开源虚拟/远程桌面基础架构，支持随时随地控制 PC 和 Android 设备，是 TeamViewer 的优秀替代品。

RustDesk开源远程桌面软件数据安全跨平台支持

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3