找到105个数据集

标签: 数据转储

过滤结果
  • 研究机构注册库数据2021_09_23

    2025年12月23日   

    数据集概述 本数据集为研究机构注册库(ROR)的数据转储,包含十万二千三百九十二家研究机构的ROR标识符及元数据,以JSON格式存储,由社区主导的开放研究机构标识符注册库提供。 文件详解 文件名称:2021-09-23-ror-data.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • Stack_Overflow帖子人工验证版本历史数据集

    2025年12月19日   

    数据集概述 本数据集包含Stack Overflow帖子的人工验证版本历史,用于评估SOTorrent平台的字符串相似性指标。针对2018年11月1日和12月14日发布的版本,已对基准真值文件进行双重检查和更新,为相关技术评估提供可靠数据支持。 文件详解 文件类型与数量:共9个文件,无目录结构...
    packageimg
  • 研究机构注册库数据转储_1_70版

    2025年12月7日   

    数据集概述 该数据集是Research Organization Registry(ROR)的公开数据转储,包含118,548个研究机构的ROR标识符及元数据,支持JSON和CSV两种格式,覆盖schema v1和v2两个版本,新增177条记录并更新346条现有记录元数据。 文件详解 文件名称: v1.70-2025-08-26-ror-...
    packageimg
  • Stack_Overflow代码片段生成问题标题论文数据集

    2025年12月7日   

    数据集概述 该数据集是论文《Generating Question Titles for Stack Overflow from Mined Code Snippets》的配套数据,内容为从Stack Overflow数据转储中提取的代码片段及相关信息,用于支持代码片段生成问题标题的研究。 文件详解 文件名称: Code2Que-data.zip...
    packageimg
  • 数据20世纪新闻档案CdV2018莱茵_美因JSON_LD转储_人物与公司

    2025年12月6日   

    数据集概述 本数据集为2018年“Coding da Vinci”黑客松发布的PM20人物与公司文件夹元数据,包含所有有公开文档的文件夹信息,以JSON-LD格式存储,为研究20世纪新闻档案相关人物与公司提供结构化元数据支持。 文件详解 文件名称:cdv2018_pressemappe20.zip 文件格式:ZIP压缩包...
    packageimg