美国房屋宜居性预测机器学习竞赛数据集
数据来源:互联网公开数据
标签:机器学习,房屋,宜居性,预测,美国,HackerEarth,竞赛,房地产,数据分析
数据概述:
本数据集是HackerEarth平台举办的“Get a Room ML Hackathon”竞赛所使用的数据集,旨在通过机器学习模型预测美国房屋的宜居性评分。 数据集包含训练集(train.csv)、测试集(test.csv)和提交样例文件(sample_submission.csv)。 训练集和测试集分别包含39496条和10500条房屋信息,用于模型的训练和评估。
数据字段描述:
* Property_ID:房屋的唯一标识
* Property_Type:房屋类型(公寓、平房等)
* Property_Area:房屋面积(平方英尺)
* Number_of_Windows:窗户数量
* Number_of_Doors:门的数量
* Furnishing:房屋装修情况(全装修、半装修、未装修)
* Frequency_of_Powercuts:每周平均停电次数
* Power_Backup:是否有备用电源
* Water_Supply:供水情况(全天候、每天一次-上午、每天一次-下午、每两天一次)
* Traffic_Density_Score:交通拥堵程度评分(1-10)
* Crime_Rate:社区犯罪率(远低于平均水平、略低于平均水平、略高于平均水平、远高于平均水平)
* Dust_and_Noise:社区的粉尘和噪音程度(高、中、低)
* Air_Quality_Index:社区空气质量指数
* Neighborhood_Review:居民对社区的平均评分
* Habitability_score:房屋宜居性评分(目标变量,仅在训练集中)
数据用途概述:
该数据集主要用于机器学习模型的训练和评估,目标是预测房屋的宜居性评分。 开发者可以使用该数据集进行特征工程、模型选择、参数调优等,构建预测模型。 此外,该数据集也可用于探索性数据分析,以了解不同因素对房屋宜居性的影响,为房地产市场分析和个人住房选择提供参考。