-
AD_NLP_Based阿尔茨海默病临床表型提取研究数据
2026年1月30日 30 48 29
数据集概述 本数据集包含基于自然语言处理(NLP)技术从临床文本中提取阿尔茨海默病(AD)相关临床表型的研究数据,涉及医疗合并症、生物标志物、神经行为测试分数等表型类型。数据支持评估NLP提取管道的性能,可为AD风险预测模型开发提供结构化表型信息,共包含2个文件。 文件详解 README.md 文件格式:MD...
-
PlanTL_Based_西班牙语临床病例语料库句子分割标注数据集_V1
2026年1月22日 30 105 48
数据集概述 本数据集为西班牙临床病例语料库(SPACCC)的句子分割标注第一版,由基于FreeLing3.1的SPACCC词性标注工具完成标注。数据集包含1个压缩文件,无目录层级,无训练/测试、数据/标签等分割,可用于西班牙语临床文本的句子分割任务研究与模型训练。 文件详解 文件名称:SPACCC_SPLIT.zip 文件格式:ZIP...
-
SPACCC_TOKEN_Based_西班牙语临床病例语料库分词标注第一版数据
2026年1月19日 30 167 63
数据集概述 本数据集为西班牙语临床病例语料库(SPACCC)的第一版分词标注数据,由基于FreeLing3.1的西班牙语临床病例语料库词性标注器(SPACCC_POS-TAGGER)生成,包含对临床文本的分词标注内容,适用于医学NLP领域的文本处理研究。 文件详解 文件名称:SPACCC_TOKEN.zip 文件格式:ZIP...
-
CodiEsp摘要与ICD10编码关联数据集
2025年12月21日 30 76 5
数据集概述 该数据集包含来自Lilacs和Ibecs数据库的医学摘要,通过UMLS Metathesaurus将MeSH术语映射为ICD10编码(含西班牙文CIE10),并补充了基于MeSH术语词匹配的额外编码。数据集以压缩包形式提供,包含结构化JSON文件、单篇摘要文本文件及标签映射表。 文件详解 该数据集以压缩包形式提供,具体说明如下: -...
-
CodiEsp西班牙语临床病例ICD10编码金标准数据集_CLEF2020
2025年12月19日 30 80 62
数据集概述 该数据集是CLEF eHealth 2020 CodiEsp赛道的西班牙语临床病例金标准语料库,包含训练集、开发集、测试集(含人工注释)及未标注背景集,共一千个临床病例,采用CIE10(西班牙版ICD10)编码术语,为非英语临床病例自动编码研究提供标注数据。 文件详解 数据集为zip压缩包,包含四个文件夹,具体如下: -...
-
Auto_Corpus_2_0_标准化临床文献与补充材料数据集
2025年12月11日 30 38 17
数据集概述 本数据集为Auto-Corpus的2.0版本,包含标准化处理的临床文献及补充材料,新增句子拆分等特征,以单份PDF文档形式呈现,为临床文本相关研究提供结构化数据支持。 文件详解 文件名称: FAIRClinical D2.3 - Release of version 2 of the clinical supplementary...
-
肺部疾病临床文本诊断数据集
2025年10月1日 30 138 102
肺部疾病临床文本诊断数据集_Lung_Disease_Clinical_Text_Diagnosis_Dataset 数据来源:互联网公开数据 标签:肺部疾病, 临床文本, 诊断, 文本分类, 医疗健康, 自然语言处理, 疾病识别, 医学 数据概述:...
-
医学笔记实体边界标记数据集NBMEAnnotationsDataset-jaideepvalani
2025年5月30日 30 59 4
医学笔记实体边界标记数据集NBMEAnnotationsDataset-jaideepvalani 数据来源:互联网公开数据 标签:医学影像,实体边界,数据集,自然语言处理,标注数据,临床文本,机器学习,医疗信息学 数据概述:...
-
医学报告文本分析数据集MedicalReportTextAnalysis-gauravmodi
2025年4月29日 30 59 19
医学报告文本分析数据集MedicalReportTextAnalysis-gauravmodi 数据来源:互联网公开数据 标签:医学报告, 文本分析, 自然语言处理, 医疗诊断, 临床文本, 疾病分类, 文本摘要, 数据挖掘 数据概述: 该数据集包含来自医疗报告的数据,记录了不同医学专业领域的患者主诉、病史、用药情况等文本信息。主要特征如下:...
-
医学实体识别数据集MedRedNERDataset-quctngngvng
2025年4月22日 30 167 50
医学实体识别数据集MedRedNERDataset-quctngngvng 数据来源:互联网公开数据 标签:医学,实体识别,数据集,自然语言处理,机器学习,生物信息学,临床文本,文本挖掘 数据概述: 该数据集包含来自医学领域的文本数据,记录了临床病历,医学报告等文档中的实体信息。主要特征如下:...
-
疾病提取黑客马拉松数据集
2025年4月17日 30 17 8
疾病提取黑客马拉松数据集 数据来源:互联网公开数据 标签:疾病提取,自然语言处理,临床文本,医疗实体识别,机器学习,健康数据分析,医疗信息抽取 数据概述:...



