数据集概述
本数据集聚焦ResearchGate平台上开放研究数据(ORD)的社交活动,包含752条ORD样本数据,分析ORD发布与社交活动(阅读、引用)的关联,探索研究者特征(领域、性别、地区等)及ORD质量对社交活动的影响,为开放科学中ORD的使用与传播研究提供数据支持。
文件详解
- 核心数据文件:
- V9_ANON.csv: CSV格式的匿名化数据集,包含752条随机抽样的ORD条目,字段涵盖研究者特征(科学领域、性别、地区等)、ORD质量、社交活动指标(引用、阅读量)等,原始信息已编码处理。
- 说明文档:
- Social activity of Open Research Data on ResearchGate-Codebook.odt: ODT格式的代码本,解释数据集(A)中的变量定义与度量标准。
- 分析脚本:
- SLODII_last-all.R: R语言脚本,包含描述性统计、逻辑回归、K-means聚类等未在最终论文中报告的探索性分析代码。
- 分析结果文件:
- 表格文件(Table 1.docx、Table 4.docx、Table 5.docx等): DOCX格式,共5个表格,呈现基于数据集的统计结果。
- 图表文件(Figure 1.png、Figure 2.png、Figure 3.png): PNG格式,共3个图表,可视化分析发现。
- 附件文件(Logistic_Regression_1.docx、Logistic_Regression_2.docx): DOCX格式,共2个附件,包含逻辑回归分析的详细结果。
适用场景
- 开放科学研究: 分析开放研究数据在学术社交网络中的传播与使用情况。
- 研究者行为分析: 探究研究者特征对开放研究数据社交活动的影响机制。
- 学术数据平台评估: 对比ResearchGate与其他数据平台在ORD社交互动上的差异。
- 计量学研究: 验证ORD质量、研究者声誉等因素与引用、阅读量的关联模型。