虚拟患者诊断历史数据集_phantomDB

数据集概述

本数据集包含两百万虚拟患者的诊断历史数据,其中一百万源自全国模型,一百万源自芝加哥大学医学中心治疗的芝加哥地区非裔美国人数据,涵盖带时间戳的诊断和程序代码,以及生成模型、软件包和验证结果。

文件详解

  • 文件名称: schema.json:JSON格式文件,包含数据集的结构定义,核心键为$schema、type、items。
  • 文件名称: data_dictionary.pdf:PDF格式文件,提供数据集的数据字典,解释数据字段含义。
  • 文件名称: USED_ICD_CODES.xlsx:Excel格式文件,列出数据中使用的ICD10诊断代码。

适用场景

  • 医疗数据研究:用于医疗诊断模式、程序代码应用规律的分析。
  • 生成式AI模型验证:可验证虚拟患者数据与真实电子健康记录的相似性。
  • 医学编码研究:分析ICD10代码在虚拟患者诊断历史中的应用情况。
  • 医疗数据隐私研究:探索在无隐私约束下高质量虚拟医疗数据的应用价值。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.05 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。