Auto_Corpus_2_0_标准化临床文献与补充材料数据集

数据集概述

本数据集为Auto-Corpus的2.0版本,包含标准化处理的临床文献及补充材料,新增句子拆分等特征,以单份PDF文档形式呈现,为临床文本相关研究提供结构化数据支持。

文件详解

  • 文件名称: FAIRClinical D2.3 - Release of version 2 of the clinical supplementary material and CRF corpora with ongoing automated updates-2.pdf
  • 文件格式: PDF (.pdf)
  • 文件内容: 包含标准化的临床补充材料与CRF语料库(2.0版本),新增句子拆分等特征,支持临床文本分析场景应用

适用场景

  • 临床文本挖掘研究: 用于探索临床文献的结构化处理方法与特征提取技术
  • 医疗NLP模型训练: 为临床自然语言处理模型提供标准化文本数据支撑
  • 临床语料库构建参考: 可作为临床领域标准化语料库建设的实例范本
  • 医疗信息抽取分析: 适用于临床文本中关键信息抽取的算法验证场景
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.69 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。