数据集概述
该数据集为"JUnit测试唯一性自动化识别"研究提供支撑,包含实验数据、评估元数据、R处理脚本、人工与研究者标注的评估数据等11个文件,覆盖测试名称唯一性检查、重命名数据及评估标准定义等内容。
文件详解
- 文档类文件:
- _README.pdf:PDF格式,提供数据集的基本说明
- Definitions of TP_FP_TN_FN for RQ1.docx:DOCX格式,定义RQ1研究问题中的真阳性、假阳性、真阴性、假阴性判定标准
- 数据类文件(.xlsx格式):
- List of connectors.xlsx:连接器列表数据
- Evaluation Data Part 2 (by human annotators).xlsx:人工标注的评估数据第二部分
- Evaluation Data Part 1 (by our researchers).xlsx:研究者标注的评估数据第一部分
- Empirical Study Data_ Check test names for the existence of uniques parts (40 Per Project, None is Mismatch).xlsx:检查测试名称唯一性部分的实证研究数据
- Rename Data.xlsx:重命名相关数据
- 压缩包文件(.zip格式):
- Evaluation MetaData Part 2.zip:评估元数据第二部分压缩包
- Evaluation MetaData Part 1.zip:评估元数据第一部分压缩包
- R Scripts for Data Processing.zip:数据处理用R脚本压缩包
- Pilot Study of Code2vec and Code2seq.zip:Code2vec和Code2seq试点研究压缩包
适用场景
- 软件测试研究:分析JUnit测试用例的唯一性特征及命名模式
- 自动化测试工具开发:为测试用例唯一性自动识别算法提供训练和评估数据
- 实证软件工程研究:支撑关于测试用例命名规范与测试有效性关系的研究
- 测试质量评估:基于人工标注数据验证自动化测试唯一性识别方法的准确性