COVID-19扩展元数据语义知识树数据集

COVID-19扩展元数据语义知识树数据集 数据来源:互联网公开数据
标签:COVID-19,元数据,医学知识,命名实体识别,知识图谱,语义分析,分类树

数据概述:
本数据集基于COVID-19开放研究数据集,通过结合医学领域专业知识和语义分析技术,对原始文章元数据进行了扩展和结构化处理。数据集包含了以下内容:
1. 每行数据的唯一编号。
2. 唯一标识符,由命名实体识别结果与文章标题组合生成。
3. 文章摘要的一般主题分类。
4. 每篇文章摘要中的关键陈述,以“主语-谓语-宾语”的形式呈现。
5. 文章摘要中提取的命名实体,基于统一医学语言系统(UMLS)的受控词汇表进行标注。
6. 基于UMLS本体的分层分类树,用于描述每篇摘要及其关键陈述的医学领域归属。

数据用途概述:
该数据集适用于多种场景,包括但不限于:
1. 知识图谱构建:通过提取关键陈述和命名实体,支持COVID-19相关医学知识图谱的构建与扩展。
2. 语义搜索与推荐:利用分类树和主题分类,提升COVID-19研究文章的语义搜索和推荐效果。
3. 医学研究与分析:为医学专家和研究人员提供结构化的医学知识和语义信息,支持深入的医学研究。
4. 教育与培训:可用于医学信息学、自然语言处理和知识工程领域的教学与实践,帮助学习者理解医学知识的语义表示与组织方式。

此外,该数据集可进一步导入至语义维基百科实例中,用于构建协作式的医学知识平台。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 95.6 MiB
最后更新 2025年4月16日
创建于 2025年4月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。