COVID-19疫情研究论文多语言标注数据集-rebeccaburwei

COVID-19疫情研究论文多语言标注数据集-rebeccaburwei

数据来源:互联网公开数据

标签:COVID-19,新冠病毒,疫情,研究,论文,语言,多语言,标注,语料库,自然语言处理

数据概述: 本数据集旨在帮助数据科学家和公共卫生专家更便捷地检索和分析CORD-19数据集,其中每篇研究论文都标注了最多3种语言。数据集包含CORD-19研究论文的语言标注信息,这些标注信息有助于研究人员根据语言进行筛选、分析和比较,从而更有效地开展跨语言的疫情研究。

数据用途概述: 该数据集可用于多种研究和应用场景,包括:多语言信息检索、跨语言文本分析、疫情研究的语言学研究、构建多语言疫情知识图谱等。研究人员可以利用此数据集筛选特定语言的研究论文,进行对比分析,从而更全面地理解疫情的全球影响;自然语言处理专家可以利用此数据集进行多语言文本处理模型的训练和评估;公共卫生领域的研究人员可以利用此数据集进行跨语言的疫情信息传播和交流研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.94 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。