-
EHSAN可解释医疗保健情感分析NLP数据集
2026年2月1日 30 195 170
数据集概述 本数据集为EHSAN(可解释医疗情感标注)数据集,包含医疗领域的情感标注数据及实验代码相关文件,共6个文件,均为XLSX格式,无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容,以及大语言模型标注的数据集。 文件详解 Final_train_topic_and_sentiment.xlsx 文件格式:XLSX...
-
CT_Based_否定表达不同方式影响研究数据
2026年2月1日 30 9 0
数据集概述 本数据集围绕“否定表达不同方式的影响”展开,关联医学CT领域相关内容,包含1个压缩文件,无子目录结构,未划分训练/测试集、数据/标签集或原始/处理数据,可用于探索否定表达在医学CT场景中的应用影响。 文件详解 文件名称:The Effect of Different Ways for Expressing Negation.zip...
-
Zenodo_Source_日本公开医疗文本记录带质量评估数据
2026年1月28日 30 45 33
数据集概述 本数据集为日语书写的公开医疗文本记录,包含质量评估内容,无隐私问题,研究人员可直接使用。数据集存储于单一压缩文件中,无训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称:pseudo_progressnotes_p.zip 文件格式:ZIP...
-
MiRoR11_P2_Based_主要与报告结局提取标注语料库数据
2026年1月27日 30 115 92
数据集概述 本数据集为MiRoR11-P2项目下的标注语料库,用于主要结局与报告结局的提取任务。包含两个子文件夹,分别存储主要结局和报告结局的标注文本,支持医疗文本中结局信息的结构化提取研究,总含多格式标注文件及交叉验证子数据集。 文件详解 Primary_outcomes子文件夹...
-
CT_EBM_SP_Based_西班牙循证医学临床试验标注语料数据
2026年1月27日 30 108 98
数据集概述 本数据集为西班牙循证医学临床试验语料库(CT-EBM-SP),包含一千二百篇西班牙语临床试验相关文本(共二十九万二千一百七十三个词元),涵盖五百篇期刊摘要及七百篇临床试验公告,标注有解剖学、药理化学物质等四类医学实体,适用于医学自然语言处理研究。 文件详解 文件名称:CT-EBM-SP.zip 文件格式:ZIP...
-
COMMUNI_CARE_Based_胰腺癌诊断医患沟通研究协议转录数据
2026年1月22日 30 115 76
数据集概述 本数据集来自COMMUNI.CARE单中心研究,纳入胰腺癌诊断时的连续患者,收集32组医患互动数据。所有互动经录音、匿名化后转录为意大利语文档,共31个文件,用于研究胰腺癌诊断阶段的医患沟通与患者参与情况。 文件详解 医患沟通转录文档 文件名称:以“PAZIENTE [编号].docx”格式命名(如PAZIENTE...
-
neurodegenerative_NLP_based神经退行性疾病临床轨迹识别研究数据
2026年1月13日 30 43 24
数据集概述 本数据集与“Identification of clinical disease trajectories in neurodegenerative disorders with natural language...
-
MEDDOPROF_Test_Set_西班牙语临床病例职业信息检测共享任务测试数据
2026年1月15日 30 71 26
数据集概述 本数据集是MEDDOPROF共享任务的测试集,用于西班牙语临床病例中职业、就业状态的自动检测。该任务包含三个子任务:职业实体识别(MEDDOPROF-NER)、职业指代分类(MEDDOPROF-CLASS)和职业标准化(MEDDOPROF-NORM),可支撑医疗、社会服务、制药等多领域的文本处理需求,数据集包含一个压缩文件。 文件详解...
-
LanguageStructure_Based_TuLeD语言结构数据集预发布版0_9
2026年1月14日 30 160 32
数据集概述 本数据集为LanguageStructure/TuLeD的预发布版本(0.9版),核心内容围绕语言结构展开,包含一个压缩文件,未提供具体描述文档及内容预览,未区分训练/测试、数据/标签、原始/处理数据,适用于语言结构相关研究场景。 文件详解 文件名称:LanguageStructure/TuLeD-0.9.zip 文件格式:ZIP...
-
公开可用的高质量真实医疗文本数据集
2025年12月19日 30 120 38
数据集概述 本数据集包含公开可用的日语医疗文本记录(病程记录),由众包工作者和医生生成,确保隐私安全,采用CC BY-NC 4.0协议授权,为医疗文本相关研究提供高质量数据支持。 文件详解 文件名称: crowd.zip 文件格式: ZIP压缩包 内容说明: 包含九千七百五十六条由众包工作者撰写的模拟病程记录 文件名称:...
-
Cochrane诊断性测试准确性参考数据集
2025年12月11日 30 64 39
数据集概述 该数据集为Cochrane诊断性测试准确性(DTA)参考数据集,对应2018年AMIA年会论文中描述的内容,用于系统性评价中诊断测试准确性的数据提取与合成自动化及评估流程。 文件详解 文件名称: CL145_open_set_20181101.zip 文件格式: ZIP (.zip) 内容说明:...
-
西班牙临床病例语料库词性标注数据集
2025年12月10日 30 97 61
数据集概述 该数据集是西班牙临床病例语料库(SPACCC)的首个词性标注版本,由基于FreeLing3.1的SPACCC_POS-TAGGER工具完成标注,为临床文本的词性分析提供结构化数据支持。 文件详解 文件名称: SPACCC_POS.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
医疗文本信息标注与实体识别数据集
2025年8月30日 30 9 6
医疗文本信息标注与实体识别数据集_Medical_Text_Information_Annotation_and_Entity_Recognition 数据来源:互联网公开数据 标签:医疗文本, 实体识别, 文本标注, 机器学习, 自然语言处理, 临床数据, 医疗健康, 命名实体识别 数据概述:...
-
医疗文本摘要与专科分类数据集MedicalTextSummarizationandSpecialtyClassificationDataset-athar...
2025年5月26日 30 133 15
医疗文本摘要与专科分类数据集MedicalTextSummarizationandSpecialtyClassificationDataset-atharvakaushik 数据来源:互联网公开数据 标签:医疗文本, 文本摘要, 专科分类, 自然语言处理, 医疗诊断, 机器学习, 文本分析, 数据清洗 数据概述:...
-
健康医疗文本信息数据集HealthMedicalTextInformation-nekuitiefangbiediant
2025年5月1日 30 91 86
健康医疗文本信息数据集HealthMedicalTextInformation-nekuitiefangbiediant 数据来源:互联网公开数据 标签:医疗健康, 文本分析, 文本挖掘, 自然语言处理, 维基百科, 数据清洗, 知识图谱, 信息检索 数据概述:...
-
医疗转录文本医学专业分类数据集MedicalTranscriptionTextMedicalSpecialtyClassificationDataset-...
2025年5月1日 30 34 13
医疗转录文本医学专业分类数据集MedicalTranscriptionTextMedicalSpecialtyClassificationDataset-adityakumarsandilya 数据来源:互联网公开数据 标签:医疗文本, 医学专业, 自然语言处理, 文本分类, 医疗健康, 机器学习, 数据标注, 临床诊断 数据概述:...
-
医疗手术文本转录数据集MedicalSurgeryTextTranscriptionDataset-manishnayakce22b069
2025年5月1日 30 210 39
医疗手术文本转录数据集MedicalSurgeryTextTranscriptionDataset-manishnayakce22b069 数据来源:互联网公开数据 标签:医疗文本, 手术记录, 文本转录, 医疗诊断, 临床报告, 自然语言处理, 数据标注, 语音识别 数据概述:...
-
医疗药品说明纠错数据集MedicalDrugDescriptionErrorCorrectionDataset-randhumonous
2025年5月1日 30 124 6
医疗药品说明纠错数据集MedicalDrugDescriptionErrorCorrectionDataset-randhumonous 数据来源:互联网公开数据 标签:药品信息, 文本纠错, 医疗健康, 自然语言处理, 深度学习, 数据清洗, 错误检测, 医疗文本 数据概述:...
-
医疗文本信息摘要生成数据集MedicalTextSummaryGeneration-sagar2inf
2025年5月1日 30 66 0
医疗文本信息摘要生成数据集MedicalTextSummaryGeneration-sagar2inf 数据来源:互联网公开数据 标签:医疗文本, 文本摘要, 自然语言处理, 临床报告, 医疗诊断, 数据标注, 深度学习, 信息提取 数据概述:...
-
医疗摘要生成自编码数据集MedicalAbstractGenerationAutoencoderDataset-stbultebelay
2025年4月29日 30 139 46
医疗摘要生成自编码数据集MedicalAbstractGenerationAutoencoderDataset-stbultebelay 数据来源:互联网公开数据 标签:医疗, 摘要生成, 文本摘要, 深度学习, 自然语言处理, 医疗文本, 自动编码器, 数据集 数据概述:...



