语音转文字

Lightning Whisper MLX开源项目 – 专为Apple Silicon优化的极速Whisper实现

Lightning Whisper MLX开源项目 – 专为Apple Silicon优化的极速Whisper实现

Lightning Whisper MLX 是一个专为 Apple Silicon 优化的 Whisper 实现，使用 MLX 框架，显著提升了 Whisper 任务的速度，比其他实现快 10 倍，比当前 MLX 实现快 4 倍。

Apple Silicon优化MLX框架Whisper实现实时音频处理

FastRTC开源项目 – Python实时通信库

FastRTC开源项目 – Python实时通信库

FastRTC 是一个强大的 Python 实时通信库，专为简化实时音频和视频流的开发而设计。它允许开发者将任何 Python 函数转换为实时音频和视频流，并通过 WebRTC 或 WebSocket 进行传输。内置语音识别和自动对话功能，开发者可以专注于核心功能设计，而无需操心底层通信细节。FastRTC 还支持语音转文字、文字转语音，使得交互更加智能。

Python实时通信库WebRTCWebSocket文字转语音

BetterWhisperX开源项目 – 改进版自动语音识别工具

BetterWhisperX开源项目 – 改进版自动语音识别工具

BetterWhisperX是基于Whisper改进的自动语音识别工具，提供单词级别的时间戳和说话人识别功能，使得语音转文字更加精准和高效。它使用了先进的技术，如wav2vec2.0强制对齐，以提高时间戳的准确性，并支持多说话人的语音处理，适合各种场景下的应用。

实时语音识别时间戳生成自动语音识别工具语音转文字

TAANQAI官网 – 语音转文字的AI面试助手

TAANQAI是一个基于生成式AI的智能面试助手，能够将语音实时转化为文本，帮助用户在面试过程中更高效地记录和分析对话内容，提升面试体验。

AI面试助手实时对话分析语言学习工具语音转文字

HeyGen开源项目 – 视频翻译功能，全套解决。

HeyGen开源项目 – 视频翻译功能，全套解决。

HeyGen 是一个全面的视频翻译解决方案，能够自动处理视频中的语音，并支持多语言翻译，适用于多种场景。

多语言翻译多语言配音对话翻译自动化视频处理

Verdad开源项目 – 移民社区虚假信息监测平台

Verdad开源项目 – 移民社区虚假信息监测平台

强大的广播内容监测平台，专注于移民社区的虚假信息检测。基于Google Gemini LLM和OpenAI Whisper打造的三阶段分析系统，可实现持续广播内容录制、自动问题内容检测、语音转文字、翻译分析等功能。

多语言翻译广播内容分析移民社区虚假信息监测自动问题检测

speech-to-speech开源项目 – 开源语音转语音助手

speech-to-speech开源项目 – 开源语音转语音助手

基于GPT4-o的模块化开源语音转文字再转语音的解决方案，支持语音活动检测、语音转文字、语言模型交互和文字转语音的连续流程，旨在提供高度模块化和可定制的语音交互体验

个性化语音助手客服系统开源语音助手教育应用

sherpa-onnx开源项目 – 支持多种语音处理功能的框架

sherpa-onnx开源项目 – 支持多种语音处理功能的框架

sherpa-onnx是一个功能强大的框架，支持语音转文字、文字转语音和说话人识别等多种功能。它设计为轻量级，能够在低功耗设备上高效运行，且遵循MIT协议，便于开发者使用和集成。

MIT协议文字转语音语音转文字说话人识别

语音识别转文字工具开源项目 – 离线语音识别，精准高效

语音识别转文字工具开源项目 – 离线语音识别，精准高效

一个离线运行的本地语音识别转文字服务，能够输出json、srt字幕及纯文字格式，支持多种语言和自定义词汇，提供高准确率的语音识别功能。

多语言支持离线语音识别工具自定义词汇支持语音转文字

JARVIS开源项目 – 个人AI语音助手

JARVIS开源项目 – 个人AI语音助手

JARVIS是一个个人AI语音助手，能够实现语音转文字、生成语言模型回复和文字转语音功能，并通过Web界面进行展示。

Web界面展示个人AI语音助手文字转语音语言模型生成回复

storly.ai官网 – 简化记录生活故事的AI平台

storly.ai是一个由人工智能驱动的平台，旨在简化记录生活故事和经历的过程。它提供采访提示和语音转文字功能，帮助用户在5分钟内写出独特的故事。

AI生成采访提示个人故事记录故事创作工具教育用途

IdeaAize官网 – 你的AI创意中心，释放无限可能！

IdeaAize是一个全方位的AI工具，利用先进的自然语言处理技术，在几秒钟内生成高质量、引人入胜的内容，帮助用户摆脱写作障碍，简化内容创作流程。

AI内容生成工具AI聊天机器人开发AI语音合成团队协作支持

FastAi官网 – 革新内容创作的AI平台

FastAi是一个前沿的AI驱动平台，通过自动生成SEO优化内容和惊艳图像，彻底改变内容创作流程。用户只需注册账户，便可访问我们的AI驱动模板，进行可扩展和高质量的内容创建，并通过智能算法自定义模板，生成引人注目的书面内容和迷人的图像。

AI代码生成器AI聊天机器人AI驱动内容创作平台SEO优化内容生成

Genice官网 – 最先进的AI工具，免费使用！

Genice是一个功能强大的人工智能工具，旨在为用户提供多种智能服务。它结合了最新的AI技术，提供高效、准确的解决方案，适用于各种应用场景。无论是数据分析、文本生成还是图像处理，Genice都能满足用户的需求，帮助提升工作效率。

AI工具免费使用图像处理数据分析

Chhaya AI官网 – 统一的AI内容创作中心

Chhaya AI是一个整合了行业领先服务的单一平台，通过自定义模板和简化内容创作的算法，显著提高生产力，是您实现高效创作的最佳解决方案。

AI内容创作平台代码生成内容生成算法博客内容创作

Console Chat GPT开源项目 – 在终端中直接使用Chat GPT

Console Chat GPT开源项目 – 在终端中直接使用Chat GPT

Console Chat GPT是一个强大的工具，允许用户在终端中直接访问OpenAI的Chat GPT和助手功能，支持Mistral AI，具备Markdown支持、代码高亮等特性。

Markdown格式支持Mistral AI支持代码高亮显示实时对话工具

AI/ML API官网 – 提供100多种AI模型的单一API

AI/ML API通过一个API为开发者提供超过100种AI模型的访问，确保全天候的创新。该API提供类似GPT-4的性能，成本比传统方案低80%，并与OpenAI无缝兼容，便于用户过渡。

AI/ML API图像生成多种AI模型访问文本转语音

Must Ai Generator官网 – 一款多功能的AI创作工具

Must AI Generator是一款多功能的AI工具，帮助用户在一个平台上进行写作、聊天、设计、编程、语音等各类创作。它利用AI技术提供高效且富有创意的解决方案，满足各种内容创作需求。用户可以简单地输入信息或关键词，AI算法将生成内容，用户可进行审阅、修改并导出最终作品。

AI创作工具SEO优化内容生成数字营销内容

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3