韩国健康检查结果数据集
数据来源:互联网公开数据
标签:韩国,健康检查,医疗数据,人口统计,国民健康保险,生活习惯,健康指标
数据概述:
本数据集包含了2002年至2020年间韩国1900万人的基本健康检查结果。韩国国民健康保险服务(NHIS)每年为所有投保人提供免费的健康检查,该数据集从每年接受健康检查的人群中随机抽取了100万人的结果。数据集涵盖了每年的健康检查结果,共计19个CSV文件,每个文件代表一年的数据。由于每年的检查项目和标准有所不同,因此各年数据在特征数量、区域代码、年龄组分类等方面存在差异。
数据用途概述:
该数据集适用于公共卫生研究、疾病预防、健康趋势分析、生活习惯调查等多种场景。研究人员可以通过数据分析了解韩国国民的健康状况,识别健康风险因素;医疗机构可利用数据优化健康管理方案;政府机构可以制定更为有效的公共卫生政策。
数据集细节说明:
数据集中各字段定义如下:
- YEAR:信息基础年份,格式为YYYY,取值范围为2002至2020。
- IDV_ID:被检查者序列号,格式为N,取值范围为1至1000000。
- AREA_CODE:被检查者居住地代码,格式为N。
- SEX:性别,格式为N,1代表男性,2代表女性。
- AGE_GROUP:根据年份将被检查者年龄分为5岁一组的代码,格式为N。2002至2013年的年龄组取值范围为1至14,2014年及以后的年龄组取值范围为1至18。
- HEIGHT:被检查者身高,单位为5厘米,格式为N/cm。
- WEIGHT:被检查者体重,单位为5千克,格式为N/Kg。
- WAIST:被检查者腰围,单位为厘米,格式为N/cm。
- SIGHT_LEFT:被检查者左眼视力,格式为N,取值范围为0.1至2.5(视力低于0.1记为0.1,失明记为9.9)。
- SIGHT_RIGHT:被检查者右眼视力,格式为N,取值范围为0.1至2.5(视力低于0.1记为0.1,失明记为9.9)。
- BP_HIGH:被检查者收缩压,单位为毫米汞柱,格式为N/mmHg。
- BP_LWST:被检查者舒张压,单位为毫米汞柱,格式为N/mmHg。
- BLDS:空腹血糖浓度,单位为每100毫升血液中的毫克,格式为N/mg/dL。
- TOT_CHOLE:总胆固醇(酯型+非酯型),正常值范围为150至250毫克/分升,单位为mg/dL。
- TRIGLYCERIDE:甘油三酯含量,正常值范围为30至135毫克/分升,单位为mg/dL。
- HDL_CHOLE:高密度脂蛋白胆固醇含量,正常值范围为30至65毫克/分升,单位为mg/dL。
- LDL_CHOLE:低密度脂蛋白胆固醇含量,若达到或超过170毫克/分升则被诊断为高LDL血症,单位为mg/dL。
- CREATININE:血清肌酐浓度,是肌酸脱水后形成的物质,正常值范围为0.8至1.7毫克/分升,单位为mg/dL。
- HMG:血红蛋白,血中氧载体,正常值范围为男性13至17克/分升,女性12至16克/分升,单位为g/dL。
- OLIG_PROTE_CD:尿液蛋白排泄情况,格式为N,取值范围为1(-)、2(±)、3(+1)、4(+2)、5(+3)、6(+4)。
- SGOT_AST:血清天门冬氨酸转氨酶,肝功能指标之一,正常值范围为男性0至40单位/升,女性0至37单位/升,单位为IU/L。
- SGPT_ALT:血清丙氨酸转氨酶,肝功能指标之一,主要存在于肝细胞中,正常值范围为男性0至40单位/升,女性0至34单位/升,单位为IU/L。
- GAMMA_GTP:γ-谷氨酰转肽酶,肝功能指标之一,正常值范围为男性11至64单位/升,女性8至35单位/升,单位为IU/L。
- SMK_STAT:被检查者吸烟状况,格式为N,取值范围为1(不吸烟)、2(曾吸烟但已戒烟)、3(当前吸烟)。
- DRK_YN:被检查者饮酒状况,格式为N,取值范围为0(不饮酒)、1(饮酒)。
- HCHK_CE_IN:被检查者是否接受口腔检查,格式为N,取值范围为0(未测试)、1(测试)。
- CRS_YN:被检查者是否患有龋齿,格式为N,取值范围为0(无)、1(有)。
- TTH_MSS_YN:被检查者是否缺失牙齿,格式为N,取值范围为0(无)、1(有)。
- ODT_TRB_YN:被检查者是否患有牙龈退缩,格式为N,取值范围为0(无)、1(有)。
- WSDM_DIS_YN:被检查者是否拥有智齿,格式为N,取值范围为0(无)、1(有)。
- TTR_YN:被检查者是否患有牙结石,格式为N,取值范围为0(无)、1(有)。
- DATE:数据创建日期,格式为YYYY-MM-DD。