数据集概述
本数据集为WASHES项目相关研究数据,包含研究论文信息、作者数据、机构信息、获奖文章信息及词云数据等,共6个文件,涵盖.xlsx、.txt、.ipynb三种格式,用于支撑相关研究分析工作。
文件详解
- 数据文件
- readme.txt:TXT格式,介绍数据文件构成及各文件用途,说明研究论文信息的划分逻辑。
- authorsdata.xlsx:XLSX格式,存储作者相关数据(具体字段未详细说明)。
- wordcloud.xlsx:XLSX格式,包含研究论文的Study ID、Year、Title、Abstract、Keywords、Language、Axis等字段,Axis字段分类为S(社会)、E(经济)、H(人类)、SE(社会和人类)、SH(社会...)等。
- awardwinningarticles.xlsx:XLSX格式,存储获奖文章相关数据(具体字段未详细说明)。
- institutions.xlsx:XLSX格式,存储机构相关数据(具体字段未详细说明)。
- 代码文件
- Analysis.ipynb:IPYNB格式,用于数据分析的代码文件(具体内容未详细说明)。
适用场景
- 研究论文信息分析:基于wordcloud.xlsx中的论文元数据,分析研究主题、关键词分布及各领域(Axis)的研究分布情况。
- 作者与机构关联研究:通过authorsdata.xlsx和institutions.xlsx,探究研究作者与机构的合作关系及分布特征。
- 获奖文章特征分析:利用awardwinningarticles.xlsx,分析获奖文章的共性特征及影响因素。
- 研究趋势可视化:结合wordcloud.xlsx和Analysis.ipynb,实现研究主题词云可视化及研究趋势分析。