DITTO-2是由Adobe和加州大学研究人员联合开发的基于扩散模型的音乐生成模型,旨在提升音乐生成的效率和可控性。它通过模型蒸馏技术和推理时间优化(ITO)显著提高了生成速度和控制精度,支持多种音乐编辑和生成功能,如音乐修复、扩展、强度调整、旋律控制和结构控制等。与传统模型相比,DITTO-2的生成效率提升了10-20倍,训练成本低,仅需在A100 GPU上训练约30小时。