生物医学信息本体概念嵌入语义相关性测量数据集

数据集概述

本数据集围绕生物医学信息本体的概念嵌入与语义相关性测量展开,通过扩展UMLS2015AB中CUI术语的维基百科定义信息,采用文档嵌入技术生成术语向量表示,为生物医学领域语义相似性模型研究提供数据支持。

文件详解

  • 文件名称: MRDEF_WIKI_DOC_LABEL_PATH.csv
  • 文件格式: CSV
  • 字段示例: 包含CUI术语编码(如C0000005、C0000039等)
  • 文件名称: MRDEF_WIKI_DOC_PATH.csv
  • 文件格式: CSV
  • 字段示例: 包含生物医学术语(如(131)I-Macroaggregated Albumin)及相关描述文本

适用场景

  • 生物医学信息学研究: 用于构建生物医学术语的语义嵌入模型,提升本体概念间相关性测量精度
  • 医学本体工程: 支持医学术语系统的语义关系优化与扩展
  • 自然语言处理应用: 为生物医学文本的语义分析、信息检索等任务提供训练数据基础
  • 医学知识图谱构建: 辅助知识图谱中实体关系的自动识别与链接
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 146.66 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。