数据集概述
本数据集为论文《Issues and Their Causes in WebAssembly Applications: An Empirical Study》的配套数据,存储于一个Excel文件中,包含9个工作表。内容涵盖开源WebAssembly应用信息、GitHub与Stack Overflow的原始问题数据、随机抽样分析数据、问题与原因分类编码及综合分类体系,用于支撑WebAssembly应用问题及成因的实证研究。
文件详解
- 文件名称:Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含9个工作表,具体如下:
- Selected Systems:12个开源WebAssembly应用的基本信息及URL链接
- GitHub-Raw Data:6,667条GitHub原始问题数据,含标题、链接、状态等字段
- SOF-Raw Data:6,667条Stack Overflow原始问答数据,含问答详情、链接、标签等字段
- GitHubData Random Selected:从GitHub原始问题中随机抽取的样本及讨论数据
- GitHub-(Issues, Causes):问题类型与原因的初始分类编码数据
- SOF (Issues, Causes):354条Stack Overflow随机抽样数据,含问题标题、正文、链接、标签及问题与原因要点
- Combine (Git and SOF) Data:整合GitHub与Stack Overflow的问题及原因数据
- Issue Taxonomy:包含9个大类、20个子类、132种具体类型的问题分类体系
- Cause Taxonomy:包含10个大类、35个子类、283种具体类型的原因分类体系
数据来源
论文“Issues and Their Causes in WebAssembly Applications: An Empirical Study”
适用场景
- WebAssembly应用问题分析: 研究开源WebAssembly应用的常见问题类型、分布特征及成因机制
- 软件工程实证研究: 支撑WebAssembly技术领域的问题分类体系构建与验证
- 开源社区问题挖掘: 分析GitHub和Stack Overflow平台上WebAssembly相关问题的分布规律与讨论热点
- 软件开发优化: 为WebAssembly应用开发者提供问题预防与排查的参考依据
- 技术生态评估: 评估WebAssembly技术在实际应用中的成熟度与潜在风险点