美国阿姆斯市房屋销售价格预测数据集-2011-rishantenis
数据来源:互联网公开数据
标签:房屋销售,房价预测,特征工程,随机森林,梯度提升,房地产,数据科学
数据概述:
本数据集包含了2011年美国阿姆斯市房屋销售的详细信息,用于预测房屋销售价格。数据集分为训练集(train.csv)和测试集(test.csv),训练集中包含目标变量SalePrice及其他属性字段,测试集则不包含SalePrice。数据集中还附带了data_description.txt文件,详细描述了每个字段的含义。
数据字段包括但不限于:
- SalePrice: 房屋销售价格(目标变量)
- MSSubClass: 建筑分类
- MSZoning: 一般分区分类
- LotFrontage: 与房产相连的道路线性英尺数
- LotArea: 地段面积(平方英尺)
- Street: 通路类型
- Alley: 小巷接入类型
- LotShape: 地段形状
- LandContour: 地段平坦度
- Utilities: 可用的公用设施类型
- LotConfig: 地段配置
- LandSlope: 地段斜率
- Neighborhood: 阿姆斯市内的物理位置
- Condition1: 靠近主要道路或铁路
- Condition2: 如果存在第二条道路或铁路,其靠近程度
- BldgType: 住宅类型
- HouseStyle: 住宅风格
- OverallQual: 整体材料和完成质量
- OverallCond: 整体状况评级
- YearBuilt: 初始建造年份
- YearRemodAdd: 重装年份
- RoofStyle: 屋顶类型
- RoofMatl: 屋顶材料
- Exterior1st: 房屋外部覆盖材料
- Exterior2nd: 如果有多种材料,房屋外部覆盖材料(第二种)
- MasVnrType: 饰面砂浆类型
- MasVnrArea: 饰面砂浆面积(平方英尺)
- ExterQual: 外部材料质量
- ExterCond: 外部材料现状
- Foundation: 基础类型
- BsmtQual: 地下室高度
- BsmtCond: 地下室总体状况
- BsmtExposure: 地下室出口等级
- BsmtFinType1: 地下室装修区域质量
- BsmtFinSF1: 地下室装修区域面积1(平方英尺)
- BsmtFinType2: 地下室第二装修区域质量(如果有)
- BsmtFinSF2: 地下室装修区域面积2(平方英尺)
- BsmtUnfSF: 地下室未装修面积(平方英尺)
- TotalBsmtSF: 地下室总面积(平方英尺)
- Heating: 加热方式
- HeatingQC: 加热质量和状况
- CentralAir: 中央空调
- Electrical: 电气系统
- 1stFlrSF: 一楼面积(平方英尺)
- 2ndFlrSF: 二楼面积(平方英尺)
- LowQualFinSF: 低质量装修面积(所有楼层)
- GrLivArea: 居住面积(地面及以上,平方英尺)
- BsmtFullBath: 地下室完整浴室数量
- BsmtHalfBath: 地下室半浴室数量
- FullBath: 地面及以上完整浴室数量
- HalfBath: 地面及以上半浴室数量
- Bedroom: 地面及以上卧室数量
- Kitchen: 厨房数量
- KitchenQual: 厨房质量
- TotRmsAbvGrd: 地面及以上房间总数(不包括浴室)
- Functional: 家庭功能评级
- Fireplaces: 火壁炉数量
- FireplaceQu: 火壁炉质量
- GarageType: 车库位置
- GarageYrBlt: 车库建造年份
- GarageFinish: 车库内部装修
- GarageCars: 车库容量(汽车)
- GarageArea: 车库面积(平方英尺)
- GarageQual: 车库质量
- GarageCond: 车库状况
- PavedDrive: �铺装车道
- WoodDeckSF: 木甲板面积(平方英尺)
- OpenPorchSF: 开放门廊面积(平方英尺)
- EnclosedPorch: 封闭门廊面积(平方英尺)
- 3SsnPorch: 三季门廊面积(平方英尺)
- ScreenPorch: 网格门廊面积(平方英尺)
- PoolArea: 游泳池面积(平方英尺)
- PoolQC: 游泳池质量
- Fence: 围栏质量
- MiscFeature: 其他未被分类的特征
- MiscVal: 其他特征的美元价值
- MoSold: 销售月份
- YrSold: 销售年份
- SaleType: 销售类型
- SaleCondition: 销售条件
数据用途概述:
该数据集适用于房屋销售价格预测、特征工程、随机森林和梯度提升算法的学习与练习等场景。研究人员和数据科学家可以利用此数据集进行房价预测模型的开发与优化;房地产开发商和投资者也可以参考该数据集进行市场分析与投资决策;教育机构可以将其作为教学资源,帮助学生理解回归分析和机器学习的基本原理。