数据集概述
本数据集是论文《TestDossier: A Dataset of Tested Values Automatically Extracted from Test Execution》的配套数据,通过监测15个Python标准库的测试套件生成,包含基础内置类型(数值、布尔、文本序列)及仅含基础类型的序列、集合、映射类型的测试值,共1234个不同参数/变量名、133169个不同值,总计1290万个独立值。
文件详解
- 文件名称:TestDossier.json
- 文件格式:JSON
- 字段映射介绍:存储从Python测试执行中自动提取的测试值,包含参数/变量名及其对应的测试值,覆盖数值(int、float、complex)、布尔(bool)、文本序列(str)、序列(list、tuple、range)、集合(frozenset、set)、映射(dict)等类型(其中序列、集合、映射仅包含基础类型)。
数据来源
论文“TestDossier: A Dataset of Tested Values Automatically Extracted from Test Execution”
适用场景
- 软件测试研究:分析Python测试套件中测试值的分布特征与覆盖情况,优化测试用例设计。
- Python类型系统研究:探究Python标准库中基础类型及复合类型的实际使用模式。
- 测试自动化工具开发:为测试数据生成、测试预言构建等自动化工具提供真实测试值样本。
- 软件质量分析:通过测试值的多样性评估Python标准库测试套件的有效性与完备性。