美国航班延误预测数据集-2022年
数据来源:互联网公开数据
标签:航班延误,航空运输,时间序列,预测,机器学习,美国,交通运输,出行
数据概述:
本数据集收录了2022年美国国内航班的详细数据,旨在用于预测航班是否会延误超过15分钟。 数据来源于美国交通部运输统计局(BTS),涵盖了所有由大型航空公司运营的国内航班。 数据集包含了2022年每个月的CSV文件,共12个文件,代表全年数据。
数据集包含以下关键字段:
- Quarter:季度(1-4)
- Month:月份
- DayofMonth:日期
- DayOfWeek:星期几
- FlightDate:航班日期
- Marketing_Airline_Network:航空公司标识符
- OriginCityName:出发城市名称
- DestCityName:到达城市名称
- DepDelay:实际起飞时间与计划起飞时间的差值(分钟),负数表示提前
- ArrDelay:实际到达时间与计划到达时间的差值(分钟),负数表示提前
- Cancelled:航班是否取消(1=是)
- Diverted:航班是否备降(1=是)
- AirTime:飞行时间(分钟)
- Distance:飞行距离(英里)
- CarrierDelay:航空公司造成的延误(分钟)
- WeatherDelay:天气原因造成的延误
- NASDelay:国家空域系统造成的延误
- SecurityDelay:安全原因造成的延误
- LateAircraftDelay:前序航班造成的延误
数据用途概述:
该数据集可用于航班延误预测模型构建、航空运输效率分析、出行决策支持等多种场景。 研究人员可以使用该数据训练机器学习模型,预测航班延误情况;航空公司可以利用该数据分析延误原因,优化运营流程;旅客可以参考数据进行出行规划。 此外,该数据集也适用于教育和研究,帮助学习者理解航空运输系统的运作机制,以及影响航班准点的各种因素。