数据集概述
本数据集是CINECA项目开发的合成数据集,基于加拿大CHILD队列研究的常见属性结构构建,包含150名合成参与者的100个变量,涵盖模拟表型数据及基于1000 Genomes项目的遗传数据,不包含真实参与者的可识别信息,用于辅助队列数据技术实现开发。
文件详解
- 文件名称:
CINECA_synthetic_cohort_NA_Canada_CHILD_dataset_v1.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含模拟CHILD队列结构的合成数据,涵盖100个变量(含表型数据及基于1000 Genomes项目的遗传数据),对应150名合成参与者,具体字段需解压后查看内部文件内容。
数据来源
CINECA项目( funding: EC H2020 grant 825775 and CIHR grant 404896)
适用场景
- 队列数据技术开发: 辅助软件开发者了解队列数据常见属性结构,支持数据发现、 harmonization、访问及联邦分析的技术实现。
- 数据模型验证: 用于测试队列数据最小元数据模型的技术适配性。
- 数据共享规范实践: 作为CC-BY-NC-SA许可下的合成数据示例,支持FAIR数据共享原则的实践应用。
- 遗传与表型数据整合测试: 基于1000 Genomes项目的遗传数据与模拟表型数据,可用于相关数据整合工具的开发测试。