数据集概述
本数据集包含Embase数据库中的随机研究参考数据,分为两个CSV文件和一个Excel文件。数据涵盖两类随机筛选的文献:1000篇去除信件的Embase文献,以及1223篇去除信件且限定人类研究的Embase文献。两类数据均包含两位评估者对文献是否为诊断准确性研究的判断、最终决策、注释,以及Embase对文献的相关标签标注。
文件详解
- Excel文件
- 文件名称:OpenDataSet_DTA_EMBASE.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含两个数据集的整合内容,具体字段与对应CSV文件一致。
- CSV文件(1000篇文献)
- 文件名称:1000_Random_DTA_Embase.csv
- 文件格式:CSV
- 字段映射介绍:包含FirstAuthor(第一作者)、Year(年份)、Acc.No.(编号)、Title(标题)、DOI(数字对象标识符)、1st Assessor(第一评估者)、2nd Assessor(第二评估者)、Comments(注释)、FinalDecision(最终决策)、EXCLUDED(排除标记)、INCLUDED(纳入标记)、DTA_Study_Label(Embase诊断准确性研究标签)。
- CSV文件(1223篇人类研究文献)
- 文件名称:1223_RandomHuman_DTA_Embase.csv
- 文件格式:CSV
- 字段映射介绍:包含FirstAuthor(第一作者)、Year(年份)、Acc.No.(编号)、DOI(数字对象标识符)、Title(标题)、1st Assessor(第一评估者)、2nd Assessor(第二评估者)、Comments(注释)、FinalDecision(最终决策)、EXCLUDED(排除标记)、INCLUDED(纳入标记)、DTA_Study Label(Embase诊断准确性研究标签)、DTA Label(Embase诊断准确性标签)、SeSp Label(Embase敏感性和特异性标签)、AND/OR(逻辑运算符标记)。
适用场景
- 文献检索策略开发: 用于测试和优化医学文献检索策略,尤其是诊断准确性研究的检索规则。
- 诊断准确性研究筛选: 分析评估者判断与Embase标签的一致性,提升文献筛选效率。
- 医学文献标注研究: 探索不同评估者对诊断准确性研究的判断差异及影响因素。
- 文献数据库标签验证: 验证Embase数据库中“Diagnostic Test Accuracy Study”等标签的准确性和覆盖范围。