AI交流(进群备注:多模态数据集)

达摩院开源的视觉-语言预训练的语料库,包含从在线教学视频中提取的多模态数据,支持多种学科的学习和研究。
多模态数据集的特点:
1. 包含650万张图片
2. 包含8亿文本
3. 涵盖数学、物理、化学等多个基础学科
4. 基于2.2万小时的在线教学视频
多模态数据集的功能:
1. 用于训练视觉-语言模型
2. 支持多模态学习和研究
3. 可用于教育领域的应用
4. 为AI研究提供丰富的数据资源
相关导航
暂无评论...
AI交流(进群备注:多模态数据集)
达摩院开源的视觉-语言预训练的语料库,包含从在线教学视频中提取的多模态数据,支持多种学科的学习和研究。
多模态数据集的特点:
1. 包含650万张图片
2. 包含8亿文本
3. 涵盖数学、物理、化学等多个基础学科
4. 基于2.2万小时的在线教学视频
多模态数据集的功能:
1. 用于训练视觉-语言模型
2. 支持多模态学习和研究
3. 可用于教育领域的应用
4. 为AI研究提供丰富的数据资源