TestDossier_Python测试执行自动提取测试值数据集

数据集概述

本数据集是论文《TestDossier: A Dataset of Tested Values Automatically Extracted from Test Execution》的配套数据,通过监测15个Python标准库的测试套件生成,包含基础内置类型(数值、布尔、文本序列)及仅含基础类型的序列、集合、映射类型的测试值,共1234个不同参数/变量名、133169个不同值,总计1290万个独立值。

文件详解

  • 文件名称:TestDossier.json
  • 文件格式:JSON
  • 字段映射介绍:存储从Python测试执行中自动提取的测试值,包含参数/变量名及其对应的测试值,覆盖数值(int、float、complex)、布尔(bool)、文本序列(str)、序列(list、tuple、range)、集合(frozenset、set)、映射(dict)等类型(其中序列、集合、映射仅包含基础类型)。

数据来源

论文“TestDossier: A Dataset of Tested Values Automatically Extracted from Test Execution”

适用场景

  • 软件测试研究:分析Python测试套件中测试值的分布特征与覆盖情况,优化测试用例设计。
  • Python类型系统研究:探究Python标准库中基础类型及复合类型的实际使用模式。
  • 测试自动化工具开发:为测试数据生成、测试预言构建等自动化工具提供真实测试值样本。
  • 软件质量分析:通过测试值的多样性评估Python标准库测试套件的有效性与完备性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 529.6 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。