GigaMIDI Dataset是一个包含约143万独特MIDI文件、530万音轨和180亿音符事件的大规模符号音乐数据集。它提供详细的元数据,包括循环注释和音乐表现力检测信息,设计用于支持音乐生成和分析研究。数据集托管在Hugging Face Hub上,覆盖多种乐器类型,其中56.8%为单音轨,43.2%为多音轨。此外,数据集还提供预训练模型,为研究人员提供额外工具。