美国航班延误分析样本数据集1987-2008-izumita
数据来源:互联网公开数据
标签:航班延误,航空运输,美国,时间序列,数据分析,航空业,交通,天气影响,航空公司
数据概述:
本数据集包含了美国1987年至2008年间各年度的航班记录,包括航班承运商、起飞和到达延误时间及延误原因。原始数据集由22个单独的压缩CSV文件组成,每个文件包含一年的国内航班数据,总计超过1.2亿行记录。为便于分析,本数据集从每个年度的原始数据中随机抽取了1000行样本数据,合并成一个包含2.2万行数据、29个字段的综合样本集。
数据用途概述:
该数据集适用于航班延误分析、航空公司运营效率评估、交通流量研究、天气影响评估等场景。研究人员可以利用此数据探索不同时间段、不同航空公司航班的延误情况及其原因;交通管理部门可据此优化航班调度和机场运营;航空公司可以评估延误对运营的影响,并采取相应措施;公众可以了解航班延误的普遍原因和影响因素。
数据集字段描述如下:
- Year: 年份
- Month: 月份
- DayofMonth: 日期
- DepTime: 实际起飞时间
- CRSDepTime: 根据中央预订系统(CRS)估算的起飞时间
- ArrTime: 实际到达时间
- CRSArrTime: 根据中央预订系统(CRS)估算的到达时间
- UniqueCarrier: 航空公司缩写代码(IATA代码)
- FlightNum: 航班号
- TailNum: 航空器编号
- ActualElapsedTime: 实际飞行时间
- CRSElapsedTime: 根据中央预订系统(CRS)估算的飞行时间
- AirTime: 飞行时间(不包括地面滑行时间)
- ArrDelay: 到达延误时间(分钟)
- DepDelay: 起飞延误时间(分钟)
- Origin: 起飞机场代码
- Dest: 目的机场代码
- Distance: 航班距离
- TaxiIn: 着陆后地面滑行时间
- TaxiOut: 起飞前地面滑行时间
- Cancelled: 航班是否取消(1表示取消,0表示未取消)
- CancellationCode: 取消原因代码
- Diverted: 航班是否改道(1表示改道,0表示未改道)
- CarrierDelay: 因航空公司原因导致的延误时间(分钟)
- WeatherDelay: 因天气原因导致的延误时间(分钟)
- NASDelay: 因国家航空系统原因导致的延误时间(分钟)
- SecurityDelay: 因安全原因导致的延误时间(分钟)
- LateAircraftDelay: 因前序航班延误导致的延误时间(分钟)
航空承运商名称来源:主要来源于公开的航空运输行业数据库。