Music LLM 是一个基于 PyTorch 的音乐生成和文本转语音(TTS)整合系统,使用以 LLaMA 为基础的大型语言模型(LLM)。其音乐生成部分可在单张 RTX 4090 GPU 上高效训练,耗时不到 10 小时,适合资源有限的研究环境。项目可能整合了现有开源项目如 ChatMusician(音乐生成)和 Llasa-8B(TTS),但具体整合方式尚不明确。