数据集概述
本数据集围绕软件工程研究中开放引文数据库的覆盖范围展开,包含23个样本期刊、204篇样本论文及其引文/参考文献覆盖数据、8篇深度分析论文的完整数据,以及统计指标和图表,为相关研究提供支持。
文件详解
该数据集包含18个文件,具体说明如下:
- 期刊信息文件:
- 01-venues.csv:CSV格式,包含23个样本期刊的CORE排名和出版商信息。
- 论文及覆盖数据文件:
- 02-articles.csv:CSV格式,含204篇样本论文的出版信息。
- 03-references-absolute.csv:CSV格式,含论文参考文献绝对数量及各数据库覆盖量。
- 04-references-relative.csv:CSV格式,含各数据库参考文献覆盖的相对数值。
- 05-citations-absolute.csv:CSV格式,含各数据库引文覆盖的绝对数量。
- 06-citations relative.csv:CSV格式,含各数据库引文覆盖的相对数值。
- 深度分析论文文件:
- 07-selected-articles.csv:CSV格式,含8篇深度分析论文的出版信息。
- 08A–08H系列CSV文件:每篇深度分析论文的数据库参考文献对比数据。
- 统计与图表文件:
- 09-Statistics.pdf/xlsx:PDF和Excel格式,含全数据集及按出版商、CORE排名、年份分组的统计指标(最小/最大值、中位数、平均值、方差)。
- 10-Figures.zip:压缩包,含参考文献和引文相关图表(EPS和PNG格式)。
适用场景
- 软件工程文献计量研究:分析开放引文数据库对软件工程论文的覆盖情况。
- 学术数据库评估:比较不同开放引文数据库在参考文献和引文覆盖上的表现。
- 研究方法优化:探索滚雪球法在软件工程研究中的数据支撑有效性。
- 学术影响力分析:基于引文数据研究软件工程期刊或论文的学术影响力。