数据集概述
西安道路交通数据集(XiAn Road Traffic)包含西安市城市道路的交通数据及相关气象数据,数据来源于高德地图开放平台,通过Python语言和网络爬虫技术获取,数据格式为JSON,经正则表达式处理后保存为CSV格式。数据集覆盖2019年8月1日至9月30日,采集时间为每日6:00至23:30,每2分钟记录一次,包含308条道路的交通数据和全市范围的气象数据。交通数据涵盖主干道、次干道和支路三种道路类型,共计1244400条记录;气象数据按区域划分,共计311100条记录。数据经过预处理,去除冗余和不完整信息,确保适合模型分析。
数据内容
数据集由两个部分组成:西安道路交通数据集和西安气象数据集。交通数据集包含1244400条记录,覆盖308条道路段,记录了2019年8月1日至9月30日期间的交通状况,包括道路名称、拥堵状态、行驶角度、行驶速度和时间戳。气象数据集包含311100条记录,覆盖西安市多个行政区域,记录了同期每日6:00至23:30的天气状况、温度、风向、风力等级和湿度等信息。交通数据按道路类型分布,主干道占比约40%,次干道约35%,支路约25%。气象数据按区域细分,覆盖西安市主要行政区域。
字段定义
西安道路交通数据集字段
- 道路标识:道路名称(name),道路段唯一标识
- 交通状态:拥堵等级(status),取值0(未知)、1(畅通)、2(缓行)、3(拥堵)、4(严重拥堵)
- 行驶信息:行驶角度(angle),车辆行驶方向角度;行驶速度(speed),单位为千米/小时
- 拥堵比例:畅通比例(expedite)、缓行比例(congested)、拥堵比例(blocked)
- 方向标识:行驶方向(direction),取值0(从起点到终点)、1(从终点到起点)
- 道路信息:道路段编号(lcodes),道路坐标(polyline)
- 时间信息:记录时间(time),格式为“年/月/日 时:分”
西安气象数据集字段
- 地理信息:城市名称(city),区域代码(adcode)
- 天气现象:天气状况(weather),取值1(晴)、2(多云)、3(阴)、4(雾)、5(小雨)
- 气象指标:实时温度(temperature),单位为摄氏度;湿度(humidity),单位为百分比
- 风力信息:风向(wind direction),取值1(东)、2(西)、3(南)、4(北)、5(东南)、6(东北)、7(西南)、8(西北);风力等级(wind power)
- 时间信息:记录时间(time),格式为“年/月/日 时:分”
数据特征
数据集时间分辨率高,每2分钟记录一次,显著优于传统交通数据集的采集频率,适合高频动态分析。交通数据覆盖西安市308条道路,包含主干道、次干道和支路,全面反映城市交通网络特征。气象数据按行政区域细分,结合天气状况、温度、湿度等多维度信息,为交通与环境交互研究提供支持。数据完整性高,经过预处理后无缺失值,交通拥堵状态和气象条件的分类清晰,适合机器学习和统计分析。时间跨度为两个月,覆盖夏季末至秋季初,包含季节性变化特征。辅助信息丰富,包括行驶角度、拥堵比例等,增强了数据在交通流分析和预测中的应用价值。
适用场景
- 交通流量分析:研究西安市道路交通流量分布及拥堵模式
- 拥堵预测建模:基于交通和气象数据构建机器学习模型,预测道路拥堵概率
- 交通与天气关联分析:探索天气条件对交通状况的影响
- 城市交通规划:优化道路网络设计和交通信号管理
- 实时交通监控:支持城市交通管理系统的动态监控与决策
- 智能交通系统开发:为自动驾驶和导航系统提供数据支持
- 环境影响研究:分析气象因素对城市交通效率的影响
数据来源
高德地图开放平台,通过Python网络爬虫技术获取JSON格式数据。