数据集概述
本数据集为建筑前期设计中聚类算法研究的代码集合,以博物馆建筑为案例,包含爬虫数据采集、研究流程处理两类Python代码文件,用于支持相关算法的实验与验证。
文件详解
该数据集包含2个目录下的Python代码文件,具体说明如下:
- 爬虫代码目录(Code/reptile/):
- Batch extraction of archdaily case text.py: .py格式,用于批量提取ArchDaily案例文本
- Crawl archdaily case url.py: .py格式,用于爬取ArchDaily案例链接
- Extract url content individually.py: .py格式,用于单独提取链接内容
- Chrome-Gooood Data Crawling.py: .py格式,用于爬取Gooood平台数据
- 研究流程代码目录(Code/Research process code/):
- Recommended Cases.py: .py格式,用于案例推荐
- Optimize clean text.py: .py格式,用于文本清洗优化
- Feature extraction using the training model.py: .py格式,基于训练模型进行特征提取
- Results validation.py: .py格式,用于结果验证
- model training.py: .py格式,用于模型训练
适用场景
- 建筑设计研究: 支持博物馆建筑案例数据的自动化采集与处理
- 聚类算法应用: 用于建筑前期设计中聚类算法的模型训练与验证实验
- 数据驱动设计: 辅助基于文本数据的建筑案例特征提取与分析
- 学术研究支持: 为建筑领域算法应用相关的实证研究提供代码工具