数据集概述
本数据集为论文《深度学习系统中的兼容性问题:挑战与机遇》的复现包,包含代码脚本、兼容性问题数据及工具调研数据,用于复现论文核心结果,支持深度学习系统兼容性问题的研究与分析。
文件详解
- code文件夹
- 文件内容:包含2个Python脚本
- soextractor.py:用于提取3072条高质量StackOverflow帖子
- soextractor_tags.py:用于提取StackOverflow标签的帖子数量
- DL compatibility issues.xlsx
- 文件格式:XLSX
- 字段映射:记录3072条问题数据,标注是否为深度学习兼容性问题(其中352条为兼容性问题);对兼容性问题提供库、阶段、症状、类型、解决方案、根本原因、异常类型等信息;针对CORE-TPL类型标注前后向不兼容及API演进模式
- Tool Survey.xlsx
- 文件格式:XLSX
- 字段映射:记录近5年(18-22)三大软件工程顶会(ICSE、FSE、ASE)的论文信息,包含标题、年份、会议、类型
数据来源
论文《Compatibility Issues in Deep Learning Systems: Problems and Opportunities》
适用场景
- 深度学习系统兼容性问题分析: 基于352条标注的兼容性问题数据,研究问题分布、类型及解决方案
- 软件工程顶会工具趋势研究: 利用工具调研数据,分析近5年SE顶会中深度学习系统相关工具的研究热点
- 开源社区问题挖掘: 通过StackOverflow帖子提取脚本,复现或扩展深度学习兼容性问题的社区数据采集
- 论文结果复现验证: 借助复现包中的代码与数据,验证原论文关于深度学习系统兼容性问题的研究结论