开源库维护者社区分析支持数据集

数据集概述

本数据集为支持开源库维护者的社区分析研究提供复现包,包含数据、脚本及工具组件,覆盖数据收集、方法解析、覆盖率分析等流程,支持研究问题的验证与扩展。

文件详解

该数据集以压缩包形式提供,内部包含五个核心组件,具体说明如下: - 数据目录(Data): - ProcessedData:包含用于研究问题分析的精炼数据集 - RawData:包含从GitHub抓取的依赖项原始数据 - RepoClonerDataAnalyser:Python项目,用于选择、克隆和过滤依赖项,支持覆盖率分析与数据收集 - methodTypeResolutionJavaParser:Java项目,用于解析和解析克隆仓库后的方法类型 - JacocoCoverageReporter:Python工具,用于将JaCoCo HTML覆盖率报告转换为CSV格式 - Survey Forms:包含面向维护者的PDF版调查问卷

适用场景

  • 开源社区研究:分析开源库依赖关系与维护者协作模式
  • 软件工程实践:探索依赖项克隆与方法解析的自动化流程
  • 代码覆盖率分析:研究JaCoCo报告转换与数据分析方法
  • 实证研究复现:支持开源维护者社区分析相关研究的验证与扩展
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 919.9 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。