美国爱荷华州房屋销售价格预测数据集-2006-2010-enock90
数据来源:互联网公开数据
标签:房价预测,房地产,房屋销售,回归分析,机器学习,建筑,销售价格,爱荷华州
数据概述:
本数据集包含了2006年至2010年间美国爱荷华州埃姆斯市房屋销售的详细信息,旨在用于预测房屋销售价格。数据集包含训练集(train.csv)、测试集(test.csv)和样本提交文件(sample_submission.csv)。其中,训练集和测试集包含多达80个特征变量,描述了房屋的各种属性,如建筑类型、地理位置、材料质量、建造年份、房间数量等,以及房屋的最终销售价格(SalePrice)。
数据字段:
SalePrice:房屋销售价格,为目标变量,是需要预测的数值。
MSSubClass:建筑类型。
MSZoning:区域分类。
LotFrontage:与街道相连的线性英尺。
LotArea:地块面积(平方英尺)。
Street:街道类型。
Alley:小巷类型。
LotShape:地块形状。
LandContour:地块平整度。
Utilities:可用设施类型。
LotConfig:地块配置。
LandSlope:地块坡度。
Neighborhood:埃姆斯市内的地理位置。
Condition1:与主要道路或铁路的接近程度。
Condition2:与主要道路或铁路的接近程度(如果有第二个)。
BldgType:房屋类型。
HouseStyle:房屋风格。
OverallQual:整体材料和完成质量。
OverallCond:整体状况评分。
YearBuilt:原始建造年份。
YearRemodAdd:改造年份。
RoofStyle:屋顶类型。
RoofMatl:屋顶材料。
Exterior1st:房屋外部覆盖材料。
Exterior2nd:房屋外部覆盖材料(如果多于一种材料)。
MasVnrType:砌体饰面类型。
MasVnrArea:砌体饰面面积(平方英尺)。
ExterQual:外部材料质量。
ExterCond:外部材料的当前状况。
Foundation:地基类型。
BsmtQual:地下室高度。
BsmtCond:地下室总体状况。
BsmtExposure:地下室墙壁的暴露程度。
BsmtFinType1:地下室装修区域的质量。
BsmtFinSF1:一型装修面积(平方英尺)。
BsmtFinType2:二型装修区域的质量(如果存在)。
BsmtFinSF2:二型装修面积(平方英尺)。
BsmtUnfSF:地下室未装修面积(平方英尺)。
TotalBsmtSF:地下室总面积(平方英尺)。
Heating:供暖类型。
HeatingQC:供暖质量和状况。
CentralAir:中央空调。
Electrical:电气系统。
1stFlrSF:一楼面积(平方英尺)。
2ndFlrSF:二楼面积(平方英尺)。
LowQualFinSF:低质量装修面积(所有楼层)。
GrLivArea:地上生活区面积(平方英尺)。
BsmtFullBath:地下室全浴室数量。
BsmtHalfBath:地下室半浴室数量。
FullBath:地上全浴室数量。
HalfBath:地上半浴室数量。
BedroomAbvGr:卧室数量(高于地下室水平)。
KitchenAbvGr:厨房数量。
KitchenQual:厨房质量。
TotRmsAbvGrd:地上总房间数(不包括浴室)。
Functional:房屋功能性评级。
Fireplaces:壁炉数量。
FireplaceQu:壁炉质量。
GarageType:车库位置。
GarageYrBlt:车库建造年份。
GarageFinish:车库内部装修。
GarageCars:车库容量(车位数)。
GarageArea:车库面积(平方英尺)。
GarageQual:车库质量。
GarageCond:车库状况。
PavedDrive:铺砌的车道。
WoodDeckSF:木甲板面积(平方英尺)。
OpenPorchSF:开放式门廊面积(平方英尺)。
EnclosedPorch:封闭式门廊面积(平方英尺)。
3SsnPorch:三季门廊面积(平方英尺)。
ScreenPorch:纱窗门廊面积(平方英尺)。
PoolArea:游泳池面积(平方英尺)。
PoolQC:游泳池质量。
Fence:围栏质量。
MiscFeature:其他未涵盖的特征。
MiscVal:杂项特征的价值。
MoSold:售出月份。
YrSold:售出年份。
SaleType:销售类型。
SaleCondition:销售条件。
数据用途概述:
该数据集主要用于房屋销售价格的预测,适用于机器学习模型训练、房地产市场分析、风险评估等多种应用场景。 它可以用于开发预测模型,帮助评估房屋价值,辅助投资决策,并为房地产行业的研究提供数据支持。 同时,该数据集也常用于教学和研究,例如,作为机器学习入门的案例,用于探索特征工程、模型选择和评估等。