Densely Captioned Images (DCI) 数据集旨在为图像提供详细的描述,以捕捉视觉细节,适用于计算机视觉领域的多种任务。
Imagen是一个文本到图像的扩散模型,具有极高的真实感,利用大型变换器语言模型来理解文本并生成高保真图像。它在COCO数据集上取得了7.27的最先进FID分数,并在样本质量和图像-文本对齐方面被人类评审者优先选择。
xCodeEval是一个大规模多语言多任务基准,用于评估代码理解、生成、翻译和检索的能力,旨在为研究和开发提供支持。
包含了从计算机视觉、自然语言处理到生物计算、气象预测等各个领域的模型,这些模型结合了幻方萤火超算集群的特点,使用并行训练、高效算子、高性能存储等方式,大幅提升原有模型的性能,节省训练时间。
HRS-Bench 是一个全面、可靠且可扩展的基准,专为评估文本到图像模型而设计。它提供了多种性能指标,确保在不同模型规模下的可扩展性和可靠性。
一个开放的生物医学图像-标题档案库、数据集和从科学文献中衍生的视觉-语言模型,旨在帮助研究人员更好地理解和利用生物医学图像及相关文献信息
EgoExoLearn是一个数据集,旨在将自我中心与外部中心的视角结合,以解析现实世界中的程序活动。该项目关注程序活动的异步数据收集,提供丰富的场景和数据,以便更好地理解人类行为。
Raspberry是一个旨在为微调具有推理能力的LLM创建开源玩具数据集的项目,特色在于通过合成复杂用户查询和自我批评数据来提升模型的推理能力。
大规模开源的遥感图像地质灾害点变化检测数据集,包含17对时变超高分辨率遥感图像,分辨率0.59m,采集自谷歌地球服务。总覆盖面积163.77平方公里,图像来自不同地理位置、时间、地表类型的地质灾害点,具有丰富的光谱异质性。