Sci_Hub用户下载行为分析数据集

数据集概述

本数据集包含Sci-Hub服务器日志相关的分析文件,基于Alexandra Elbakyan提供的服务器日志数据,展示全球用户访问该平台下载学术论文的行为特征,包括用户分布、文献下载偏好等核心信息,为研究学术资源获取模式提供数据支持。

文件详解

该数据集包含4个独立文件,具体说明如下: - Sci-Hub.ipynb:IPython Notebook格式,可能为数据分析代码文件,用于处理和可视化Sci-Hub用户行为数据 - publisher_DOI_prefixes.csv:CSV格式,包含出版商DOI前缀信息,字段包括Name(机构名称)、Prefix(DOI前缀)、Date Joined(加入日期)、Date of Last Deposit(最后存储日期)、Date of Last Query(最后查询日期) - Sci-Hub.html:HTML格式,可能为数据说明或分析结果的网页展示文档 - scihub_data.zip:ZIP压缩包格式,可能包含原始或处理后的Sci-Hub用户行为数据

适用场景

  • 学术资源获取行为研究:分析全球不同地区用户访问Sci-Hub的动机与偏好
  • 开放获取政策评估:对比合法渠道与Sci-Hub的学术资源获取差异
  • 出版行业研究:探究出版商DOI前缀与用户下载行为的关联
  • 信息传播研究:追踪学术文献在非传统渠道的传播路径与范围
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 654.37 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。