带时间戳的文本转录

WhisperX开源项目 – 强制时间对齐的精确语音识别

WhisperX开源项目 – 强制时间对齐的精确语音识别

WhisperX是一个强制时间对齐的时间戳精确版Whisper语音识别工具，能够高效地进行多语言的语音识别，并生成带有精确时间戳的文本转录，适用于各种音频处理场景。

多语言语音识别带时间戳的文本转录强制时间对齐的语音识别工具

STT开源项目 – 深度学习语音转文本工具包

STT开源项目 – 深度学习语音转文本工具包

STT是一个经过实战验证的深度学习工具包，专注于语音转文本技术，适用于研究和生产环境。

多语言支持实时语音转文字开源工具深度学习语音转文本工具包

Mictoo官网 – 强大的免费音视频转录工具

Mictoo 是一个出色的免费音视频转录工具，用户可以轻松地将音频文件或录音转换为文本。它允许用户收集、存储和组织音频资产，使其成为一个方便的转录工具。用户可以通过点击录音按钮开始录制音频或上传现有音频文件，工具会实时自动转录音频为文本笔记，用户还可以使用强大的编辑器对转录内容进行编辑和组织。此外，Mictoo 还允许用户通过生成可分享链接与同事分享录音和转录内容。

会议记录工具免费音视频转录工具实时音频转录音频资产管理

Meetslay.com官网 – 会议中的AI助手

Meetslay.com是一个专为会议设计的人工智能工具，旨在帮助用户记录和管理会议内容，确保重要信息不会被遗忘。无论是准备发言还是应对突发会议，Meetslay.com都能提供支持，让您在会议中更加自信和高效。

AI会议管理工具会议总结生成工具会议记录助手语音识别会议助手

llama-utils开源项目 – 最简单快速的定制LLM运行工具

llama-utils开源项目 – 最简单快速的定制LLM运行工具

llama-utils是一个便捷高效的工具，旨在支持用户在本地或边缘设备上运行定制和优化的语言模型(LLM)。它提供简单的操作方式，帮助用户快速部署和管理模型，同时确保高效的性能和资源利用。

定制LLM运行工具本地模型部署模型管理工具边缘设备语言模型

WhisperLive开源项目 – 近实时的语音转文本服务

WhisperLive开源项目 – 近实时的语音转文本服务

WhisperLive是OpenAI的Whisper的近实时实现，通过语音活动检测(VAD)仅在检测到语音时发送音频数据到Whisper模型，从而减少数据传输并提高转录准确性。

实时转录教育工具转录虚拟会议字幕语音活动检测

fairseq开源项目 – 用于多种序列建模的开源工具包

fairseq开源项目 – 用于多种序列建模的开源工具包

fairseq是一个用于序列建模的开源工具包，支持多种自然语言处理和语音处理任务。

fairseq对话系统序列建模文本生成

bark.cpp开源项目 – 高效的C++语音合成库

bark.cpp开源项目 – 高效的C++语音合成库

bark.cpp是Suno AI的Bark项目在C/C++中的移植，旨在实现快速的语音合成推理。它支持多种声音模型，具有可扩展的架构，并经优化以适应实时应用场景。

Bark项目移植C++语音合成库实时语音合成语音生成API

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3