数据集概述
本数据集是“生成式AI在软件架构中的应用、趋势、挑战与未来方向”研究的复制包,包含研究过程中使用的搜索查询、文献筛选日志、数据提取表、纳入研究编码表等内容,支持研究的可重复性验证与进一步分析。
文件详解
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:包含复制包概述,以表格形式列出各数据表的名称及简要描述,如Query、White_Literature_Process等表的功能说明。
- 文件名称:Replication Package.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含多个数据表,具体如下:
- Query:记录所有数据库和网络来源的精确搜索字符串,适配不同搜索引擎语法。
- White_Literature_Process:同行评审文献筛选日志,含标题/摘要筛选、全文筛选、滚雪球纳入、质量评估等阶段的作者独立评分。
- Grey_Literature_Process:灰色文献筛选日志,结构同白色文献表,含各阶段决策及评审者列。
- Extraction_Form:选定论文的数据提取表。
- Accepted_Papers_WhiteGrey:纳入研究整合表,含元数据及工作类别、架构风格、分析方法、LLM模型等编码变量。
- Open_Ended:自由文本目的与主题代码映射表,用于定性分析。
- Publication_Venue:纳入研究的发表 venue 聚合表,含数量及 venue 类型。
- LLMModel_Table:LLM家族及模型使用汇总表,支持模型 adoption 趋势图表生成。
数据来源
MLR论文(未提供具体标题,需引用伴随的MLR论文)
适用场景
- 生成式AI软件架构研究复现:验证原研究的搜索策略、文献筛选及编码过程的可重复性。
- 软件架构研究方法分析:分析生成式AI在软件架构领域的研究设计、数据提取与编码方法。
- 生成式AI应用趋势研究:利用Accepted_Papers_WhiteGrey表中的编码变量,分析生成式AI在软件架构中的应用场景、模型使用及挑战。
- 文献计量分析:通过Publication_Venue表研究生成式AI软件架构相关研究的发表 venue 分布与趋势。
- 定性研究方法应用:基于Open_Ended表探索生成式AI软件架构研究中的目的与主题关联。