数据集概述
本数据集为德国大学医学中心(UMC)2009-2017年完成的临床试验交叉注册监测研究相关数据,包含中间数据集、最终交叉注册对数据集及人工验证结果三类文件,支持临床试验交叉注册的识别、验证与分析,共8个文件。
文件详解
- 中间数据集(.rds格式)
- 文件名称:trn-registry-data.rds、title-matched-10.rds、trn-publications.rds、trn_trn.rds
- 文件格式:RDS
- 字段映射介绍:记录交叉注册识别过程数据,包括注册库中的试验注册号、标题匹配(距离10)结果、相关出版物中的注册号,以及三者合并后的中间数据
- 最终交叉注册对数据集(.rds格式)
- 文件名称:crossreg_pipeline_output.rds
- 文件格式:RDS
- 字段映射介绍:每行代表唯一注册对,含注册对关联方式(如标题匹配)等信息,为研究主要分析基础(需过滤得到IntoValue内EUCTR交叉注册数据)
- 人工验证原始数据(.xlsx格式)
- 文件名称:manual_validation_raw.xlsx
- 文件格式:XLSX
- 字段映射介绍:人工筛选EUCTR交叉注册的原始数据,含交叉注册是否确认、同一试验不同注册的关键特征
- 人工验证处理数据(.csv格式)
- 文件名称:manual_validation_processed.csv
- 文件格式:CSV
- 字段映射介绍:原始验证数据的处理版本,含数据修正、清洗及衍生变量,字段包括trn1、trn2、registry1、registry2、is_true_crossreg等
- 人工提取汇总结果(.xlsx格式)
- 文件名称:sumres.xlsx
- 文件格式:XLSX
- 字段映射介绍:人工筛选的所有潜在EUCTR交叉注册的汇总结果,需通过is_true_crossreg字段过滤同一完成状态的交叉注册
数据来源
IntoValue项目代码仓库(https://github.com/quest-bih/intovalue-crossreg、https://github.com/maia-sh/intovalue-data)及Zenodo数据集(https://zenodo.org/records/7633995)
适用场景
- 临床试验交叉注册监测研究:分析德国UMC临床试验中EUCTR交叉注册的特征与规律
- 临床试验注册数据质量评估:验证交叉注册识别方法的准确性,评估注册数据的一致性
- 临床试验监管政策制定:为完善临床试验注册规范、减少重复注册提供数据支持
- 医学研究方法学分析:探索临床试验交叉注册对研究透明度与可重复性的影响
- 临床试验数据整合应用:支持多来源临床试验注册数据的合并与关联分析