癌症临床试验入组资格评估数据集2005-2023

癌症临床试验入组资格评估数据集2005-2023 数据来源:互联网公开数据 标签:癌症,临床试验,入组资格,自然语言处理,深度学习,医学知识提取,肿瘤治疗

数据概述: 本数据集收录了2005年至2023年间来自全球公开癌症临床试验注册库的49,201份干预性临床试验协议中的6,186,572条标注的临床陈述。数据涵盖了临床试验的干预措施、研究条件和入组资格等字段。这些字段中的入组资格标准包含了详细的包含和排除条件,通常以自由文本形式呈现,如段落、项目符号列表或编号列表等。数据集通过将入组资格标准与研究条件和干预措施合并,转化为包含两个特征的短文本列表:标签(Eligible或Not Eligible)和处理后的文本。

数据用途概述: 该数据集适用于癌症临床试验的入组资格评估、自然语言处理研究、深度学习模型训练以及医学知识提取等多种场景。研究人员可以通过分析该数据集来改进临床试验的入组标准,提高患者参与度;医疗机构和临床研究者可以利用此数据集培训深度学习模型以自动判断患者是否符合临床试验的入组条件;此外,数据集也可用于肿瘤治疗领域的研究,帮助识别不同肿瘤类型的等效治疗方法。

举例: 一条示例临床陈述可能是:“年龄在18岁至70岁之间,且未接受过化疗或放疗的患者。”该陈述的标签为“Eligible”,表示符合条件的患者。另一条示例可能是:“既往有心脏病史的患者。”该陈述的标签为“Not Eligible”,表示不符合条件的患者。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 37.45 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。