JUnit测试唯一性自动化识别数据集

数据集概述

该数据集为"JUnit测试唯一性自动化识别"研究提供支撑,包含实验数据、评估元数据、R处理脚本、人工与研究者标注的评估数据等11个文件,覆盖测试名称唯一性检查、重命名数据及评估标准定义等内容。

文件详解

  • 文档类文件:
  • _README.pdf:PDF格式,提供数据集的基本说明
  • Definitions of TP_FP_TN_FN for RQ1.docx:DOCX格式,定义RQ1研究问题中的真阳性、假阳性、真阴性、假阴性判定标准
  • 数据类文件(.xlsx格式):
  • List of connectors.xlsx:连接器列表数据
  • Evaluation Data Part 2 (by human annotators).xlsx:人工标注的评估数据第二部分
  • Evaluation Data Part 1 (by our researchers).xlsx:研究者标注的评估数据第一部分
  • Empirical Study Data_ Check test names for the existence of uniques parts (40 Per Project, None is Mismatch).xlsx:检查测试名称唯一性部分的实证研究数据
  • Rename Data.xlsx:重命名相关数据
  • 压缩包文件(.zip格式):
  • Evaluation MetaData Part 2.zip:评估元数据第二部分压缩包
  • Evaluation MetaData Part 1.zip:评估元数据第一部分压缩包
  • R Scripts for Data Processing.zip:数据处理用R脚本压缩包
  • Pilot Study of Code2vec and Code2seq.zip:Code2vec和Code2seq试点研究压缩包

适用场景

  • 软件测试研究:分析JUnit测试用例的唯一性特征及命名模式
  • 自动化测试工具开发:为测试用例唯一性自动识别算法提供训练和评估数据
  • 实证软件工程研究:支撑关于测试用例命名规范与测试有效性关系的研究
  • 测试质量评估:基于人工标注数据验证自动化测试唯一性识别方法的准确性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.16 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。