找到7个数据集

标签: Software Heritage

过滤结果
  • SWH_Based_UNIBO机构关联代码仓库提取数据集_2024

    2026年1月27日 0 205 85

    数据集概述 本数据集为从Software Heritage档案库提取的博洛尼亚大学(UNIBO)关联源代码仓库精选集合,通过关键词搜索与启发式规则筛选,包含仓库URL、修订ID、目录ID及去重作者列表等元数据,支持开放科学、机构仓库分析等研究。 文件详解 文件名称:unibo_repositories_swh.json 文件格式:JSON...
    packageimg
  • Software_Heritage_Selected_C程序AST结构JSON数据

    2026年1月15日 30 99 55

    数据集概述 本数据集包含从Software Heritage平台选取的C程序抽象语法树(AST)相关文件,通过AST大小筛选热门代码生成。包含C源文件、对应的JSON格式AST文件及说明文档,总计3个文件,用于代码结构分析与AST研究。 文件详解 README 文件格式:无扩展名 内容介绍:说明数据来源为Software...
    packageimg
  • UNIBO_Open_Science_2024_2025_Course_Project_Data

    2026年1月11日 30 165 25

    数据集概述 本数据集是2024-2025学年开放科学课程期末项目使用的数据,整合自AMS Acta、Software Heritage、Zenodo和iris四个存储库,包含11个文件,涵盖CSV、JSON和TXT格式,核心为学术文献、软件资源等开放科学相关的结构化与半结构化数据。 文件详解 数据文件...
    packageimg
  • LaTeX_English_Wikipedia_英文维基百科LaTeX公式数据_20241123

    2026年1月8日 30 193 139

    数据集概述 本数据集为英文维基百科中使用的LaTeX(texvc)输入的公开转储,包含2024年11月23日的标准化输出结果。数据以JSON格式存储,涵盖英文维基百科中的LaTeX公式内容及相关标准化处理数据,共包含2个文件。 文件详解 文件名称:en-wiki-formulae-good.json 文件格式:JSON...
    packageimg
  • 全球公共代码贡献性别差异复制数据包

    2025年12月11日 30 138 94

    数据集概述 本数据集是论文《全球公共代码贡献性别差异》的复制数据包,包含复制研究结果所需的软件工具、初始数据文件及处理脚本,支持从数据导出、清理到性别检测、区域分析的全流程复现,为验证公共代码贡献中的性别差异研究提供完整资源。 文件详解 数据集包含文档、压缩包和脚本文件,具体说明如下: - 文档文件: -...
    packageimg
  • 公共代码贡献地域多样性复制数据包

    2025年12月5日 30 184 117

    数据集概述 本数据集是支持论文《公共代码贡献地域多样性——一项跨越五十年的探索性大规模研究》的复制数据包,包含复现研究所需的原始数据文件、处理脚本、数据库操作指令及图表生成工具,为复现公共代码贡献者地域分布的分析结果提供完整流程支持。 文件详解 该数据集包含代码文件、数据文件、脚本文件及文档,具体说明如下: - 代码文件(.py格式,共九个): -...
    packageimg
  • C文件的JSON抽象语法树数据集

    2025年12月4日 30 69 66

    数据集概述 本数据集提供了一个C语言文件的抽象语法树(AST),以JSON格式存储。该C文件是从Software Heritage平台的热门代码片段中,依据AST大小随机选取的,为代码结构分析提供基础数据。 文件详解 文件名称: ast.json 文件格式: JSON (.json) 内容说明:...
    packageimg