RapBank 是首个用于说唱生成的数据集,包含从 YouTube 收集的说唱歌曲,并提供了精心设计的数据处理流程。数据集包含 92,371 首歌曲,涵盖 84 种语言,总时长 5,586 小时。数据集结构包括视频 ID、标题、播放列表信息等,用户可通过提供的流程进行数据处理。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型