PubMedCentral患者摘要数据集用于临床决策支持-2023-priyamchoksi

PubMedCentral患者摘要数据集用于临床决策支持-2023-priyamchoksi 数据来源:互联网公开数据 标签:PMC,患者摘要,临床决策支持,检索系统,数据集,医学研究,基准测试,相似性分析 数据概述: 本数据集是一个开创性的资源,旨在开发和评估基于检索的临床决策支持(ReCDS)系统。数据集包含从PubMed Central(PMC)病例报告中提取的167,000份患者摘要,以及310万条患者与文章的相关性标注,以及根据PubMed引用图定义的29.3万条患者与患者之间的相似性标注。该数据集对于推进临床决策支持研究和患者信息检索具有重要价值。

数据集详细信息: 患者摘要:从PubMed Central(PMC)病例报告中提取的167,000份患者摘要。 患者-文章相关性:310万条标注,指示患者与文章之间的相关性。 患者-患者相似性:29.3万条标注,定义基于PubMed引用图的患者之间相似性。 基准测试:包括用于ReCDS基准测试的训练、开发和测试数据。 参考文献:数据集中使用的文章在meta_data/PMC-Patients_citations.json中进行了引用。

数据用途概述: 临床决策支持:开发和评估系统以检索相关信息以辅助临床决策。 基准测试:使用提供的数据基准测试和比较不同的ReCDS系统。 相似性分析:分析患者相似性及其与临床信息的相关性。

引用: 如果您在研究中使用此数据集,请引用以下论文: Zhengyun Zhao, Qiao Jin, Fangyuan Chen, Tuorui Peng, Sheng Yu. (2023). A large-scale dataset of patient summaries for retrieval-based clinical decision support systems. Scientific data, 10(1), 909. URL: https://api.semanticscholar.org/CorpusID:266360591

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 180.53 MiB
最后更新 2025年5月4日
创建于 2025年5月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。