Aivis: AI Voice Imitation System 是一个先进的语音生成工具,能够生成高音质且富有情感的语音。它支持创建、训练和推断Bert-VITS2模型的数据集,广泛应用于语音合成、模型训练和AI研究领域。
So-vits-svc(也称Sovits)是一款基于VITS、soft-vc、VISinger2等技术的开源免费AI语音转换软件。它能够快速学习目标声音特征,实现高质量的语音克隆与变声,适用于多种场景如AI配音、虚拟主播、音乐翻唱等。
Audiogen Codec (agc)是一个开源的音频编解码器,提供低压缩率的48khz立体声神经音频编解码,适用于一般音频,旨在优化音频保真度。
End Boost 是一款自动混音和母带处理音频的软件,利用 Alex Audio Butler 的 AI 算法,根据预设混合并优化语音、音乐和音效。用户只需将音频导入软件,End Boost 将自动应用自定义的音量曲线、压缩、限制和降噪,提供高质量的整体混音。
可本地部署的AI语音工具箱,提供语音识别、语音转写、语音转换等功能,支持音频处理、数据集创建和模型训练,适用于音频文件到理想语音模型的转换。
Supervised是一个平台,允许用户使用OpenAI的GPT引擎构建监督型大语言模型(LLMs)。它提供用户友好的界面,支持使用自定义数据来微调AI模型。用户还可以通过Supervised API部署、变现和集成他们的模型。
Stems ST-02是一款强大且易于使用的音频分离工具,能够高质量和高精度地分离人声和伴奏音轨。
Wenet STT Python是一个基于WeNet的语音识别库,旨在提供高效、准确的语音转文本功能。它支持多种语言,能够实时处理语音输入,并允许用户自定义模型以满足特定需求,易于与现有Python项目集成。
MetaVoice Studio是一个前沿平台,旨在彻底改变创作者的配音制作方式,结合超真实的人声,为项目注入丰富的情感和真实性。
VocalRemover.co是一个帮助DJ、音乐制作人和卡拉OK爱好者将歌曲分离成音轨的网站,支持高质量的音频处理,便于重混或移除特定音元素。
Clip.audio 是一个先进的AI音频搜索引擎,改变了用户发现、生成和混音音频的方式。它通过高级算法提供超过两百万种来自互联网的音频,支持多种音频格式,界面友好,适合各种创意项目。
DevMind是一个集成各种AI能力的创意平台,支持聊天补全、图像生成、人脸交换、语音转换、吉祥物创建、魔法头像、二维码艺术、视觉AI、图像放大等功能,现阶段可免费使用。
该项目是一个基于Colab的Gradio网页界面,旨在便捷地运行和使用多个已训练好的大语言模型,支持用户直接输入文本并进行生成,同时也允许使用自定义模型进行文本生成,适用于自然语言处理和文本生成等多个领域的研究和应用。
LLMFarm是一个基于GGML库构建的项目,支持在iOS和MacOS平台上离线运行多个大语言模型,提供用户友好的界面和高效的模型加载与推理功能。
专门为构建个性化普通话文本转语音(TTS)系统而设计的语音语料库,提供多样的语音样本,适合训练深度学习模型,支持多种语音合成技术的研究与应用,易于扩展和集成到现有的TTS框架中。
LIDO是一款AI音乐生成器,可以根据用户提供的歌词和风格创作出逼真的自定义歌曲。无论您需要为TikTok、Reels、视频或其他内容制作免版税音乐,LIDO都能满足您的需求。
SEPIA 服务器支持通过WebSocket连接进行开源语音识别,易于自定义与扩展,兼容多种语音识别引擎。
由Mozilla.ai开发的开源平台,旨在帮助用户选择适合自己需求的语言模型,支持评估总结任务,特色在于提供在线和离线模型评估