bioRxiv预印本流行度与成果追踪数据集

数据集概述

本数据集是用于生成2019年1月13日发布于bioRxiv的论文《Tracking the popularity and outcome of all bioRxiv preprints》中图表的数据,包含预印本下载量、发表情况、作者机构等多维度信息及对应图表文件。

文件详解

  • 数据文件:
  • authors_per_institution.csv:CSV格式,包含作者与机构关联数据
  • downloads_per_month_per_year.csv:CSV格式,按年月统计的下载量数据
  • publications_per_category.csv:CSV格式,按类别统计的发表数据
  • downloads_by_months.csv:CSV格式,包含预印本ID、发布时间、分类、月份及下载量字段
  • submissions_per_month_cumulative.xlsx:XLSX格式,月度累积提交数据
  • downloads_per_month.xlsx:XLSX格式,月度下载量数据
  • 图表文件:
  • figure3.pdf、figure4.pdf等10个PDF格式图表文件,对应论文中的研究结果可视化内容
  • 文本与压缩文件:
  • journal_interval_dunnstest.txt:TXT格式,期刊间隔Dunn检验结果
  • predatory_journals.txt:TXT格式,掠夺性期刊列表
  • rxivist_api_spider.zip、rxivist_web.zip:ZIP格式,数据采集相关压缩包

适用场景

  • 学术传播研究:分析预印本下载量随时间的变化趋势
  • 出版趋势分析:探究不同学科预印本的发表期刊分布特征
  • 开放科学评估:评估bioRxiv平台预印本的学术影响力
  • 科研政策制定:为科研机构制定预印本发布策略提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 165.32 MiB
最后更新 2025年12月18日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。