该项目是一个基于PyTorch框架的音乐源分离系统,能够将音乐混合文件分离为人声、低音、鼓声、其他声部和背景音。支持UNet、BSRoformer等多种模型架构,提供从环境配置、数据集下载到模型训练和音乐分离的完整流程。使用musdb18hq数据集(约30GB),训练时间约3小时(单RTX4090,10万步),适合深度学习开发者和音乐处理爱好者。