数据集概述
本数据集基于2015年9月17日的DBLP文献数据库快照,收录了2000-2015年81个关键计算机科学会议的出版物记录,含作者、编辑、机构等信息及性别推断数据,为相关研究提供支持。
文件详解
数据集包含一个压缩文件,解压后包含以下文件:
- 核心SQL文件(共7个):
- affiliation.sql:创建affiliation表,含作者机构及发表年份字段
- affiliation_coord.sql:创建affiliation_coord表,含作者机构的国家、国家代码、经纬度字段
- authors.sql:创建authors表,含作者位置、姓名、性别、性别推断概率字段
- author_gender.sql:创建genauth_old表,存储作者性别信息
- editor.sql:创建editors表,含编辑关联ID、位置字段
- editor_gender.sql:创建genedit表,存储编辑性别信息
- main.sql:创建general表,含文章唯一ID、发表年份、会议缩写、交叉引用、领域标识、出版商、DOI链接字段
- README文件:提供数据集及属性描述
适用场景
- 计算机科学领域学术趋势分析
- 会议作者性别分布研究
- 机构学术产出地域分布分析
- 编辑构成与会议领域关联性研究
- 学术合作网络构建与分析