数据集概述
该数据集包含伊朗高校学术出版物及教授计量数据,通过网络爬虫从Google Scholar收集,涵盖超一百五十万篇论文记录,包含论文标题、引用量、作者及机构 affiliation 等信息,支持科学计量学研究。
文件详解
数据集包含4个CSV格式文件,具体说明如下:
- universities.csv:CSV格式,字段包括Rank(排名)、University(高校名称)、Town(城市)、org_id(机构ID)、GNM(GNM值)、latitude(纬度)、longitude(经度)
- professors.csv:CSV格式,字段包括id(教授ID)、name(姓名)、university(所属高校)、user_id(用户ID)、affiliation(机构)、v_email_at(验证邮箱)、interests(研究方向)、cited_by_all(总引用量)、cited_by_since_2020(2020年以来引用量)、h_index_all(总h指数)、h_index_since_2020(2020年以来h指数)、i10_index_all(总i10指数)、i10_index_since_2020(2020年以来i10指数)、yearly_data(年度数据)
- final_articles.csv:CSV格式,未提供预览字段,推测包含论文核心指标数据
- articles.csv:CSV格式,未提供预览字段,推测包含论文基础信息数据
数据来源
Google Scholar
适用场景
- 伊朗高校学术影响力评估:分析高校排名、学术产出及引用表现
- 学术合作网络研究:探究教授间合作关系及机构间学术联系
- 科学计量学分析:研究论文引用模式、h指数分布及学科发展趋势
- 科研政策制定:为伊朗高等教育科研资源分配与发展规划提供数据支持