PMC临床试验解缠表格数据集2014

数据集概述

该数据集基于PubMed Central 2014年公开样本中6558篇临床试验文章构建,通过匹配PMC与Medline文档并筛选含“Clinical”类型的文献,经TableDisentangler工具处理、UMLS/MetaMap标注,包含患者年龄、性别分布、FEV1指标(仅COPD研究)等提取结果。

文件详解

  • 文件名称:Clinicaldata.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含来自PMC的原始XML格式临床文档
  • 文件名称:Database.zip
  • 文件格式:ZIP压缩包
  • 内容说明:包含经TableDisentangler和TabInOut工具处理后的结构化数据库,含临床试验相关提取数据

数据来源

PubMed Central

适用场景

  • 临床试验数据结构化研究:分析非结构化文献到结构化数据的转换方法
  • 医学信息抽取应用:验证年龄、性别、FEV1等临床指标的自动提取效果
  • 呼吸疾病研究:支持COPD相关临床试验中FEV1指标的统计分析
  • 医学自然语言处理:作为医疗文本标注与信息抽取模型的训练或测试数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 277.23 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。