肥胖数据分析数据集

肥胖数据分析数据集 数据来源:互联网公开数据
标签:肥胖,饮食习惯,身体状况,机器学习,特征工程,健康数据,数据预处理

数据概述:
本数据集基于UCI Estimation of Obesity Levels Based on Eating Habits and Physical Condition数据集整理而成,包含3个文件:
1. 原始数据文件original_data.csv,包含原始肥胖数据,但带有随机的NULL值。
2. 处理后的数据文件data_ready.csv,是随机抽取的1,000个数据点的样本,已通过KNNImputer填充NaN值,并移除了“性别”和“体重”两列。“性别”因分布均衡未提供额外信息,“体重”因与目标特征高度相关可能导致多重共线性而被移除。
3. 测试数据文件test_later.csv,包含额外数据,用于测试训练好的机器学习模型。

数据用途概述:
该数据集适用于机器学习模型的训练与测试,特别是肥胖相关问题的预测分析。研究人员可以利用此数据集进行特征工程研究、肥胖影响因素分析以及模型性能评估。此外,数据集还可用于验证数据预处理技术的有效性,如缺失值填充和特征选择方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.1 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。