Sampling_Threat_Based_软件工程跨库使用模式挖掘采样威胁研究数据

数据集概述

本数据集围绕跨库使用模式挖掘中的采样威胁展开,聚焦软件工程工具对代码关系、规律、模式或规则的挖掘场景,探讨基于特定库和框架筛选的项目样本对跨库模式泛化性的影响。通过模拟实验和真实案例研究不同采样方法的威胁。

文件详解

  • 文件名称:Archive.zip
  • 文件格式:ZIP
  • 字段映射介绍:数据集唯一文件,为压缩包格式,具体内部文件结构及字段需解压后查看,内容可能包含模拟实验数据、真实案例数据及相关分析结果。

数据来源

论文“The Sampling Threat when Mining Generalizable Inter-Library Usage Patterns”

适用场景

  • 软件工程模式挖掘研究:分析跨库使用模式挖掘中采样方法对结果泛化性的影响机制。
  • 代码推荐工具优化:为提升代码推荐、自动补全工具的可靠性提供采样策略改进依据。
  • 软件分析方法评估:评估不同采样方法在挖掘跨库使用模式时的有效性与局限性。
  • GitHub数据使用研究:探究GitHub搜索API在获取软件项目样本时的潜在偏差及应对方案。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.65 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。