数据集概述
本数据集包含用于训练新生儿囊性纤维化机器学习诊断模型的相关数据及生成代码,旨在提升IRT-胰蛋白酶原免疫反应性筛查项目的准确性,减少假阳性结果。数据集共9个文件,涵盖2017-2021年的模拟数据、整合数据及生成代码,可支持相关机器学习模型的训练与验证。
文件详解
- 数据文件(共8个)
- 文件名称:Dados Simulados 2017.csv、Dados Simulados 2018.csv、Dados Simulados 2019.csv、Dados Simulados 2020.csv、Dados Simulados 2021.csv、Todos os dados.csv、Todos os dados less 2020.csv、DadosSimulados 2017.xlsx
- 文件格式:CSV(7个)、XLSX(1个)
- 字段映射介绍:包含性别(Sexo)、种族(Etinia)、孕周(Tempo de Gestacao(sem))、肠外营养(Nutricao Parental)、采集时间(h)(Tempo de coleta (h))、体重(Peso)、首次结果异常(Prim. Resultado Alterado)、首次及二次结果异常(Prim. E Seg. Resultado Alterado)、确诊状态(Confirmado)等字段
- 代码文件(共1个)
- 文件名称:GenerateFCData.ipynb
- 文件格式:IPYNB
- 内容介绍:用于生成囊性纤维化相关数据的代码文件
数据来源
论文“Newborn Cystic Fibrosis Diagnosis Made Accurate and Efficient with Machine Learning to Reduce False Positives in IRT-Trypsinogen Immunoreactive Screening Program”
适用场景
- 新生儿疾病筛查优化:提升IRT-胰蛋白酶原筛查项目对囊性纤维化的诊断准确性,减少假阳性结果
- 机器学习模型训练:用于训练和验证新生儿囊性纤维化诊断相关的机器学习模型
- 医学数据分析:分析新生儿囊性纤维化诊断相关的临床特征与确诊状态的关联
- 医疗筛查策略研究:为新生儿疾病筛查项目的流程优化提供数据支持