Whisper Turbo 是 Open AI 开源的一个新型 Whisper turbo 模型,基于 Large v3 模型的蒸馏,显著提高了运行速度和效率。该模型在保持高准确度的同时,提供了更佳的显存使用效率,适用于多种音频处理任务。
InfraVisN AI利用可扩展的神经网络技术,重新定义基础设施管理,确保精确的缺陷检测和维护效率。该平台专为增长而设计,可以适应不断变化的需求,为智能和可扩展的检查设定了新的标准。
Unmixr AI是一个全方位的SaaS平台,提供AI语音合成、转录、写作辅助和图像生成等多种工具,旨在提升内容创作的效率和创造力。
AnglE是最新的文本嵌入模型,旨在优化文本嵌入,作为新一代的语义文本相似度方法,取得了新的最先进(SOTA)结果。它提供了预训练模型,包括语言模型(LLM)和数据集。
Hello Transcribe是一款私密安全的语音转文本应用,采用OpenAI Whisper技术,适用于iPhone、iPad和Mac。用户可以轻松转录语音笔记、音频文件、视频、播客,以及通过麦克风进行口述。
Whisper Wizard 利用 ChatGPT 技术,将您的语音转化为更优质的书面邮件、文档等,同时加速您在 macOS 上的写作流程。
DenoLyrics是一个基于AI模型的网络应用,支持143种语言,提供音频转录、字幕、文本摘要和多语言翻译。它使用大型模型Whisper进行实时语音识别。
PlainScribe是一款强大的应用程序,简化了将庞大文件转录为完美文本的过程,支持音频和视频文件的转换,准确度极高,适用于教育、媒体、商业等多个领域。
textlesslib是一个专为无文本口语处理设计的库,集成了多种先进的AI模型,提供高效的音频特征提取,支持多种语言的处理,且开放源代码,易于扩展。
M-AILABS语音数据集:免费提供用于语音识别和语音合成的大型语音数据集,旨在帮助企业和开发者更好地利用人工智能和机器学习技术。
Whisper for Large Audio 是一个简单的解决方案,旨在帮助用户处理大音频文件的转录问题。用户可以直接在浏览器中将任意大型音频文件分割,并利用 OpenAI 的 Whisper 对分割后的部分进行转录,只需一键即可获得完整的转录文本,消除了文件大小限制和手动操作的繁琐。
SearchArray是一个基于Pandas的扩展数组,提供了词法匹配功能(如BM25),可以将Pandas的字符串列转换为词项索引,从而实现高效的短语和单词评分。
OpenICL是一个开源的框架,旨在支持上下文学习,提供多种算法和灵活的接口,便于集成到现有的自然语言处理模型中。