新冠病毒计算研究数据库202109

数据集概述

该数据集是包含新冠病毒相关研究的数据库,数据提取自PubMed、bioRxiv、medRxiv和arXiv,结合Semantic Scholar的文献及作者指标。通过机器学习将文献分为药理学、基因组学等六个主题并排序,数据库定期更新。

文件详解

  • 文件名称: cscov_09_2021.png
  • 文件格式: PNG (.png)
  • 内容说明: 当前CSCoV版本的数据集统计图表
  • 文件名称: cscov_09_2021.tsv
  • 文件格式: TSV (.tsv)
  • 字段示例: title(标题)、abstract(摘要)、journal(期刊)、DOI(数字对象标识符)、date(日期)、collection(来源库)、topic(主题分类)、auth.papers(作者论文数)、auth.cit.(作者被引数)等
  • 文件名称: schema.json
  • 文件格式: JSON (.json)
  • 内容说明: 元数据文件,包含字段定义和主键信息
  • 文件名称: cscov_09_2021.tar.gz
  • 文件格式: GZIP压缩包 (.tar.gz)
  • 内容说明: 用于深度学习模型的Doc2Vec和DeepWalk特征文件

适用场景

  • 新冠病毒研究文献计量分析: 统计不同主题文献分布及学术影响力
  • 机器学习模型训练: 利用文献特征数据训练主题分类或优先级排序模型
  • 医学研究热点追踪: 分析新冠病毒相关研究的发展趋势和重点方向
  • 学术资源整合: 为科研人员提供结构化的新冠病毒研究文献检索工具
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 172.58 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。