PubMedCentral患者摘要数据集用于临床决策支持-2023-priyamchoksi
数据来源:互联网公开数据
标签:PMC,患者摘要,临床决策支持,检索系统,数据集,医学研究,基准测试,相似性分析
数据概述:
本数据集是一个开创性的资源,旨在开发和评估基于检索的临床决策支持(ReCDS)系统。数据集包含从PubMed Central(PMC)病例报告中提取的167,000份患者摘要,以及310万条患者与文章的相关性标注,以及根据PubMed引用图定义的29.3万条患者与患者之间的相似性标注。该数据集对于推进临床决策支持研究和患者信息检索具有重要价值。
数据集详细信息:
患者摘要:从PubMed Central(PMC)病例报告中提取的167,000份患者摘要。
患者-文章相关性:310万条标注,指示患者与文章之间的相关性。
患者-患者相似性:29.3万条标注,定义基于PubMed引用图的患者之间相似性。
基准测试:包括用于ReCDS基准测试的训练、开发和测试数据。
参考文献:数据集中使用的文章在meta_data/PMC-Patients_citations.json中进行了引用。
数据用途概述:
临床决策支持:开发和评估系统以检索相关信息以辅助临床决策。
基准测试:使用提供的数据基准测试和比较不同的ReCDS系统。
相似性分析:分析患者相似性及其与临床信息的相关性。
引用:
如果您在研究中使用此数据集,请引用以下论文:
Zhengyun Zhao, Qiao Jin, Fangyuan Chen, Tuorui Peng, Sheng Yu. (2023). A large-scale dataset of patient summaries for retrieval-based clinical decision support systems. Scientific data, 10(1), 909. URL: https://api.semanticscholar.org/CorpusID:266360591