数据集概述
本数据集包含用于估算房地产市场缺失房价的Python代码及西班牙特鲁埃尔市两个社区(市中心、Ensanche)的房价原始数据,支持通过机器学习与降维技术组合模型进行房价估算,为房地产市场主体模拟研究提供数据基础。
文件详解
- 文件名称: PythonCodeAndDatasetRealEstateEstimationV2.zip:压缩文件,包含实现房价估算的开源Python代码(含main.py主程序文件)、data文件夹(内有dataRaw.csv原始数据、dataShuffled.csv打乱数据及模型输出估算文件)、boxplotErrors.eps结果对比图表。
- 文件名称: dataRaw.csv:CSV格式原始房价数据文件,字段包括Neighborhood(社区)、Flat(是否公寓)、Bedrooms(卧室数)、Area(面积)、PriceThousandsEuros(房价千欧元)等。
- 文件名称: dataRaw-Notes.txt:TXT格式说明文件,内容为社区编码注释(0代表市中心;1代表Ensanche)。
适用场景
- 房地产经济研究:分析特鲁埃尔市特定社区房价影响因素及缺失值估算方法
- 机器学习应用:测试不同机器学习与降维技术组合在房价预测任务中的性能
- 计算社会科学:为房地产市场主体模拟模型的参数优化提供实证数据支持
- 数据科学方法论:研究交叉验证在房价估算中的应用效果