新冠疫情相关文献中地理位置信息数据集-CORD-19文献-2020年-charlieharper

新冠疫情相关文献中地理位置信息数据集-CORD-19文献-2020年-charlieharper 数据来源:互联网公开数据 标签:COVID-19,新冠疫情,地理位置,空间数据,CORD-19,文献分析,自然语言处理,地名识别,疫情传播,公共卫生 数据概述: 本数据集收录了从CORD-19(COVID-19 Open Research Dataset,新冠病毒开放研究数据集)全文本文章中提取的地理位置信息。数据基于2020年3月20日发布的CORD-19版本,通过spaCy自然语言处理工具提取了文章中提及的地理位置,并使用ArcGIS Online进行地理编码。目前,该数据集未经清洗。

数据用途概述: 该数据集可用于疫情相关的空间分析、疫情传播研究、地名识别、地理信息可视化等。研究人员可利用此数据分析疫情期间不同地理位置的文献关注度、研究热点,或结合其他疫情数据进行空间关联分析。该数据集也可用于构建地理信息系统,可视化疫情相关的研究成果,为公共卫生决策提供参考。

该数据集由凯斯西储大学Kelvin Smith图书馆的数字学术自由中心Charlie Harper和Ben Gorham制作,并使用了凯斯西储大学高级研究计算核心设施的高性能计算资源。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 336.5 MiB
最后更新 2025年5月10日
创建于 2025年5月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。