美国房屋宜居性预测机器学习竞赛数据集

美国房屋宜居性预测机器学习竞赛数据集 数据来源:互联网公开数据 标签:机器学习,房屋,宜居性,预测,美国,HackerEarth,竞赛,房地产,数据分析 数据概述: 本数据集是HackerEarth平台举办的“Get a Room ML Hackathon”竞赛所使用的数据集,旨在通过机器学习模型预测美国房屋的宜居性评分。 数据集包含训练集(train.csv)、测试集(test.csv)和提交样例文件(sample_submission.csv)。 训练集和测试集分别包含39496条和10500条房屋信息,用于模型的训练和评估。

数据字段描述: * Property_ID:房屋的唯一标识 * Property_Type:房屋类型(公寓、平房等) * Property_Area:房屋面积(平方英尺) * Number_of_Windows:窗户数量 * Number_of_Doors:门的数量 * Furnishing:房屋装修情况(全装修、半装修、未装修) * Frequency_of_Powercuts:每周平均停电次数 * Power_Backup:是否有备用电源 * Water_Supply:供水情况(全天候、每天一次-上午、每天一次-下午、每两天一次) * Traffic_Density_Score:交通拥堵程度评分(1-10) * Crime_Rate:社区犯罪率(远低于平均水平、略低于平均水平、略高于平均水平、远高于平均水平) * Dust_and_Noise:社区的粉尘和噪音程度(高、中、低) * Air_Quality_Index:社区空气质量指数 * Neighborhood_Review:居民对社区的平均评分 * Habitability_score:房屋宜居性评分(目标变量,仅在训练集中)

数据用途概述: 该数据集主要用于机器学习模型的训练和评估,目标是预测房屋的宜居性评分。 开发者可以使用该数据集进行特征工程、模型选择、参数调优等,构建预测模型。 此外,该数据集也可用于探索性数据分析,以了解不同因素对房屋宜居性的影响,为房地产市场分析和个人住房选择提供参考。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.99 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。