Amphion开源项目 – 音频、音乐和语音生成工具包
Amphion 是一个开源工具包,旨在支持音频、音乐和语音生成领域的可重复研究,并帮助初级研究人员和工程师进入该领域。它实现了多种先进的模型架构,包括基于扩散、变压器、VAE 和流的模型,并提供生成的音频的综合客观评估。Amphion 的核心目标是为研究任何输入到音频的转换提供一个平台,支持多种生成任务,如文本到语音(TTS)、歌唱语音合成(SVS)、语音转换(VC)、口音转换(AC)、歌唱语音转换(SVC)、文本到音频(TTA)等。此外,Amphion 还提供了多种声码器和评估指标,确保生成任务的一致性和高质量。