CORD-19论文中引用的数据集元数据分析数据集-googleai
数据来源:互联网公开数据
标签:COVID-19, CORD-19, 数据集, 元数据, 论文, 引用, 科学研究, 数据挖掘, 搜索引擎, 数据集搜索
数据概述:
本数据集包含了CORD-19数据集中的论文与论文中引用的数据集之间的对应关系,并整合了数据集的元数据信息。CORD-19是一个由多个机构共同创建的关于COVID-19的开放研究数据集。谷歌数据集搜索团队对该数据集进行了增强,增加了数据集的元数据。具体来说,这些数据集的元数据是从网络上各种数据存储库的schema.org标记中收集的。数据集中的每一行代表一个论文-数据集对,包含CORD-19数据集中的cord_uid,论文标题和URL,以及数据集的元数据信息。
数据用途概述:
该数据集主要用于研究论文与数据集之间的关联关系,以及分析论文中引用的数据集的特征。研究人员可以利用该数据集进行数据挖掘,探索论文中常用的数据集类型、数据集的来源以及它们在不同研究领域的应用。此外,该数据集也为数据集搜索引擎提供了数据支持,有助于改进数据集的发现和检索。该数据集可以用于以下方面:
1. 评估数据集对论文内容的影响:通过链接数据,研究人员可以深入了解数据集如何为论文提供额外的见解。
2. 改进数据集搜索:为数据集搜索引擎提供数据,以提高数据集的发现和检索能力。
3. 分析数据集引用模式:研究论文中数据集的引用模式,了解不同研究领域对数据集的需求。
4. 支持科学研究:为研究人员提供一个更全面的数据集信息,促进科学研究的进展。