数据集概述
本数据集是2022年2月Wikidata平台上WikiProject Clinical Trials项目的内容快照,包含该项目的示例SPARQL查询代码及对应查询结果数据文件,支持复现临床试验相关的特定主题数据查询,反映当时Wikidata中临床试验数据的状态。
文件详解
- 代码文件:
- 1 WikiProject Clinical Trials 2022-02.ipynb: Jupyter Notebook格式,包含项目的示例SPARQL查询代码,用于调用Wikidata内容
- 数据文件(CSV格式,共22个):
- 主题分类:
- 模型概况类: Clinical_trials_for_Zika_fever.csv、Clinical_trials_using_COVID-19_vaccine.csv等
- 主题计数类: Count_of_clinical_trials.csv、Medical_conditions.csv等
- 机构关联类: Clinical_trials_at_Vanderbilt_University.csv、Clinical_trials_where_the_sponsor_was_Pfizer.csv等
- 研究者人口统计类: Count_of_principal_investigators_by_gender.csv等
- 内容范围类: Most_common_properties_applied_to_clinical_trials.csv、Count_of_trial_records_in_Wikidata_per_clinical_trial_registry.csv等
- 字段示例: 包含propertyLabel(属性标签)、count.value(计数)、registryLabel.value(注册库标签)等字段
- 图片文件(PNG格式,共7个):
- Wikidata_WikiProject_Clinical_Trials_-screenshot-2022-02-_query.png等: 项目页面截图,展示2022年2月项目界面状态
适用场景
- 临床试验数据研究: 分析特定疾病(如寨卡热、COVID-19)、机构(如范德堡大学)相关的临床试验分布
- 医学数据可视化: 基于研究者性别、资助机构等维度的临床试验计数数据开展统计分析
- 开放数据平台研究: 探究Wikidata中临床试验数据的内容范围与属性特征
- 语义查询复现: 参考示例SPARQL查询代码,学习如何从Wikidata获取结构化临床试验数据
- 学术研究支持: 为临床试验相关的文献分析、政策研究提供实证数据基础