找到179个数据集

标签: 开源项目

过滤结果
  • Bazel构建技术降级实证研究数据集

    2026年2月15日 30 141 45

    数据集概述 本数据集为论文“The Classics Never Go Out of Style: An Empirical Study of Downgrades from the Bazel Build Technology”的配套数据,包含研究所需的数据集与脚本文件,支持复现Bazel构建技术降级的实证分析结果,共包含2个文件。 文件详解...
    packageimg
  • 违反常识的移动应用漏洞实证研究数据集

    2026年2月15日 30 78 23

    数据集概述 本数据集为移动应用常识违反类缺陷实证研究的数据成果,包含自动采集的33650条Android应用开源项目问题报告、5342条人工分析的缺陷报告、358条带分类体系的常识原则及202条错误消息分类样本,支持软件缺陷检测与常识违反类缺陷的研究分析。 文件详解 自动采集问题数据集 文件名称:collected_issues.json...
    packageimg
  • GitHub_Source_公共代码仓库相似分组数据集_2016

    2026年1月28日 30 96 61

    数据集概述 本数据集包含2016年10月的公共GitHub仓库相似分组数据,采用加权Jaccard相似度(阈值0.8~0.9)将高度相似的仓库分为多个组。数据格式为JSON,整体结构为列表嵌套列表,每个内层列表对应一组相似仓库。 文件详解 文件名称:github_duplicates.json 文件格式:JSON...
    packageimg
  • 圣文森特和格林纳丁斯国家物种名录2017

    2026年2月9日 30 172 157

    数据集概述 本数据集是2017年圣文森特和格林纳丁斯的物种名录,通过effechecka工具结合geonames多边形简化版本收集而来,包含该国及部分行政区域的分类单元列表,为生物多样性研究提供基础数据支持,数据集仅含一个压缩文件。 文件详解 文件名称:saintvincentandthegrenadines.zip 文件格式:ZIP...
    packageimg
  • Smells_开源项目代码坏味道引入实证研究数据

    2026年2月9日 30 76 27

    数据集概述 本数据集围绕代码坏味道引入问题展开,基于200个开源项目的变更历史,通过识别坏味道引入提交、挖掘超50万次提交并手动分析9164次相关提交,探究开发者引入坏味道的时间、场景及原因,为代码质量优化提供实证依据。 文件详解 文件名称:smell-introduction.zip 文件格式:ZIP...
    packageimg
  • Eclipse_Case_Study_单元测试代码崩溃分析数据

    2026年2月9日 30 204 94

    数据集概述 本数据集是针对Eclipse项目开展的“单元测试代码是否会崩溃”案例研究的数据集合,包含三个文件:JaCoCo生成的代码覆盖率文件、Eclipse项目崩溃堆栈跟踪文件压缩包,以及整合覆盖率与堆栈跟踪后生成的分析结果文件,用于支持代码质量与崩溃关联性的研究。 文件详解 jacoco.xml 文件格式:XML...
    packageimg
  • 开放式敏捷组织与社区_开发开源项目的第二次评审数据集

    2026年1月31日 30 134 96

    数据集概述 本数据集为研究“组织与开源项目开发社区中的开放敏捷变革方法”提供支撑,包含第二次系统文献综述的相关数据,共一个文件,用于记录和分析开源项目开发场景下的敏捷变革实践与研究成果。 文件详解 文件名称:Second Review.xlsx 文件格式:XLSX...
    packageimg
  • GitHub_Based拉取请求模板使用情况调查数据

    2026年1月31日 30 25 21

    数据集概述 本数据集围绕GitHub平台上拉取请求模板的使用情况展开调查,包含原始数据及爬取脚本两类文件,可用于分析模板在代码协作中的应用现状,为开发流程优化提供参考。 文件详解 Pull_Request_Template_Data.zip 文件格式:ZIP 字段映射介绍:包含GitHub拉取请求模板使用情况调查的原始数据,具体内容需解压后查看...
    packageimg
  • LiSA4ROS2_Based_ROS2仓库分析结果数据

    2026年1月30日 30 51 27

    数据集概述 本数据集包含LiSA4ROS2仓库中所有纳入数据集的分析结果,可通过指定链接访问原始数据集。数据以压缩包形式存储,提供导航页面用于查看结果,涵盖仓库文件结构、类型分布等分析内容。 文件详解 文件名称:analysis-results.zip 文件格式:ZIP 字段映射介绍:压缩包内包含分析结果文件,可通过analysis-...
    packageimg
  • 多语言配对代码与注释变更_代码注释一致性研究数据_zip

    2026年1月30日 30 120 43

    数据集概述 本数据集用于硕士论文“LLMs for Code Comment...
    packageimg
  • React_Based_Web_Apps代码异味检测数据集

    2026年1月30日 30 170 80

    数据集概述 本数据集包含React Web应用代码异味检测相关数据,共21个文件,主要为CSV格式(20个)和XLSX格式(1个)。涉及carbon、ant-design-pro等多个开源项目的代码文件异味检测记录,涵盖文件规模、组件数量、函数数量、导入数量及具体异味类型等信息。 文件详解 CSV文件(共20个)...
    packageimg
  • SATD_Based_开源项目问题跟踪系统技术债务实例数据

    2026年1月30日 30 44 8

    数据集概述 本数据集包含从微软Visual Studio、GitLab Community Edition等5个开源项目中收集的286个基于问题跟踪系统的自承认技术债务(SATD-I)实例。数据用于研究SATD-I的来源、处理周期、引入原因及类型分布,为技术债务管理工具设计提供实证支持。 文件详解 文件名称:Beyond the Code_Mining...
    packageimg
  • GitHub_Source_软件库间使用模式采样问题研究数据

    2026年1月29日 30 43 28

    数据集概述 本数据集围绕软件库间使用模式挖掘中的采样问题展开,分析不同采样方法对库客户端项目模式泛化性的影响。通过模拟实验与GitHub真实案例研究,探讨特定库采样、析取采样等方法的效果,揭示真实数据与模拟结果的差异,为库间使用模式挖掘的采样策略优化提供依据。 文件详解 文件名称:Archive.zip 文件格式:ZIP...
    packageimg
  • Myriad_People_新媒体艺术开源项目及贡献者数据集

    2026年1月29日 30 92 19

    数据集概述 本数据集聚焦新媒体艺术领域,收录9件参展艺术作品所使用的124个开源项目及其所有贡献者信息。数据来源于斯德哥尔摩“myriad”展览相关的艺术家开源征集,覆盖新媒体艺术创作涉及的多软件层,为研究新媒体艺术背后的技术生态提供支持。 文件详解 repos_info.json:JSON格式,记录124个开源项目的基础信息...
    packageimg
  • Hibernate_Based_公共项目外部依赖实验结果数据

    2026年1月29日 30 153 143

    数据集概述 本数据集记录了针对使用Hibernate开发的公共项目开展的外部依赖实验结果,包含正确与错误外部依赖的统计信息,仅包含一个文件。 文件详解 文件名称:HibernateExperimentsPublicProjects.xlsx 文件格式:XLSX...
    packageimg
  • Python_Based_测试异味对代码缺陷影响定量分析数据集

    2026年1月29日 30 9 3

    数据集概述 本数据集为日本软件科学会志论文所用,围绕Python测试异味对被测试代码缺陷潜在性的影响展开定量分析。包含3个文件,涵盖测试异味检测结果、代码指标及缺陷标记等信息,用于软件质量评估研究。 文件详解 README.txt 文件格式:TXT 内容介绍:数据集说明文档,阐述数据来源、文件构成及使用背景。 commit_hash_data.json...
    packageimg
  • Mercury_Source_航空交通模拟器数据样本_开源项目

    2026年1月28日 30 120 65

    数据集概述 本数据集为开源航空交通模拟器Mercury的输入数据样本,用于支持模拟器运行。数据按场景和子文件夹结构组织,包含航空器性能、航空公司、机场、成本函数、延误参数、飞行计划、网络管理、乘客行程等静态和动态信息,便于用户快速部署和测试模拟器功能。 文件详解 文件名称:Mercury_data_sample.zip 文件格式:ZIP...
    packageimg
  • DomainDebt_Based_开源项目领域债务影响分析数据集

    2026年1月28日 30 2 0

    数据集概述 本数据集为论文《An analysis of the impact of domain debt in open-source projects》的配套数据,包含开源项目领域债务相关的原始数据、筛选数据、数据库结构文件及最终研究用仓库列表,共5个文件,用于支持领域债务对开源项目影响的分析研究。 文件详解 original_boa.txt...
    packageimg
  • EMSE_Based_微服务采用对开发速度影响队列研究复制包数据

    2026年1月28日 30 69 43

    数据集概述 本数据集是EMSE期刊论文《微服务采用是否影响开发速度?一项队列研究》的官方复制包,包含实现数据收集、预处理、分析的全部Python代码,以及研究过程中生成的分析图表、文章图表文件,支持复现研究结论。 文件详解 安装说明文件:INSTALL,TXT格式,包含各工具及Python依赖的详细安装步骤...
    packageimg
  • JOSSE_Annotated_软件开发工作量专家估算标注数据集

    2026年1月28日 30 95 66

    数据集概述 本数据集为JIRA开源软件工作量(JOSSE)数据集,包含从Apache、JBoss、Spring三个开源项目的JIRA问题跟踪系统收集的软件开发与维护任务,标注了实际工作量,其中百分之十九的任务额外标注了专家估算值,每个数据点含任务描述文本属性,还说明了数据收集方法及六项数据质量优化流程。 文件详解...
    packageimg