波士顿房价数据集含相关变量

波士顿房价数据集含相关变量 数据来源:互联网公开数据 标签:房价预测,波士顿,房地产,相关性分析,特征工程,数据预处理 数据概述: 本数据集基于波士顿标准大都市统计区域(SMSA)1970年的数据,收录了波士顿郊区和城镇的住房信息。数据集包含14个特征变量,如城镇人均犯罪率、住宅用地比例、商业用地比例、是否邻近查尔斯河、一氧化二氮浓度、每栋住宅平均房间数、房屋建造年代、到就业中心的加权距离、高速公路可达性指数、全值财产税率、师生比、城镇黑人比例、低社会地位人口比例、以及住宅中位价值等。此外,数据集还通过直接变换、线性组合、多项式变换、交互项生成及带有微小变化的重复特征等方式,引入了多个与原始特征相关的衍生变量。 数据用途概述: 该数据集适用于房价预测模型的训练与评估、房地产市场分析、特征工程研究以及数据预处理技术的学习与应用。通过分析这些相关变量,研究人员和开发人员可以更好地理解影响房价的各种因素,从而优化预测模型的性能。同时,数据集也适合用于教育培训,帮助学习者掌握数据处理和特征工程的基本方法。 举例: 例如,通过分析“RM”(每栋住宅平均房间数)及其衍生特征(如“RM_noisy”、“RM_squred”或“RM_LINEAR_COMBO”)与“MEDV”(住宅中位价值)之间的相关性,研究人员可以探索房间数量对房价的具体影响,以及不同特征变换对预测结果的影响程度。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.18 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。