数据集概述
该数据集是研究论文"ORCID作为在线存在聚合器:数据提取与分析算法提案"的配套数据,包含基于ORCID公共API开发的两个算法(关键词搜索ORCID ID、在线存在数据提取)及对应的输出结果文件,支持学术研究者在线存在的数据分析。
文件详解
- 算法文件(R格式):
- Algoritmo_busca keywords ORCID IDs.R:通过ORCID API根据关键词提取ORCID ID的算法,输出以关键词命名的.txt文件,包含符合条件的16位字母数字ORCID ID列表
- Algoritmo_presenca online ORCID.R:通过ORCID API提取研究者在线存在数据的算法,可输出原始数据表、汇总数据表、国家-域名交叉表及在线存在网络图
- ORCID ID列表文件(TXT格式):
- ORCID IDs_academic communication.txt、ORCID IDs_research communication.txt等5个文件:分别对应关键词(学术传播、研究传播等)搜索得到的ORCID ID列表
- 在线存在数据集(XLSX格式):
- Presenca online_dataset.xlsx:包含4个工作表,对应在线存在算法输出的原始数据、汇总数据、交叉表等结果
- 网络图文件(HTML格式):
- Figuras 2 e 3 - rede de presenca online.html:在线存在平台(域名)的共现网络图
适用场景
- 学术影响力研究:分析研究者在线存在的平台分布与地域特征
- 科研数据挖掘:基于ORCID ID批量提取研究者公开学术信息
- 科研社交网络分析:构建研究者在线存在的平台共现网络模型
- 学术传播研究:探究不同国家研究者使用的在线学术传播渠道偏好