欧洲主题公园运营数据集2018-2022

数据集概述

本数据集记录了两个欧洲知名主题公园(PortAventura World 和 Tivoli Gardens)在2018年至2022年期间的综合运营数据,包含游乐设施等待时间、天气条件、设施调度、游客入园量以及娱乐表演安排等多维度信息。数据集旨在支持主题公园运营分析、游客流量预测、设施效率优化以及游客体验改善等研究应用。

数据结构与规模

数据集包含6个核心文件,总计超过370万条记录:

  • weather_data.csv:天气数据(207,264条记录,28个字段)
  • waiting_times.csv:等待时间记录(3,509,324条记录,14个字段)
  • entity_schedule.csv:设施调度信息(38,307条记录,7个字段)
  • link_attraction_park.csv:设施与公园对应关系(39条记录,2个字段)
  • attendance.csv:入园人数统计(2,367条记录,3个字段)
  • parade_night_show.csv:娱乐表演时间表(671条记录,5个字段)

时间覆盖范围

数据收集时间跨度为2018年1月至2022年8月,覆盖约5年的运营周期。等待时间数据以15分钟为间隔记录,提供高频次的运营状态监测。天气数据以小时为单位采集,包含温度、湿度、风速、降水等关键气象指标。

核心字段说明

等待时间数据:包含39个不同游乐设施的实时等待时间、运营状态、载客量、设施容量等运营指标。

天气数据:记录巴黎地区(坐标48.873492, 2.295104)的详细气象信息,包括温度范围(-12.24°C至41.26°C)、湿度(2%-100%)、气压、风速风向、降雨降雪量等。

设施调度:详细记录各游乐设施的开放时间、关闭时间、维护状态及更新记录。

入园统计:按日统计两个公园的游客入园人数,范围从最低的负数值(可能表示数据调整)到最高80,642人。

数据质量特征

整体数据质量良好,大部分文件缺失值比例较低。天气数据中部分字段(如能见度、海平面气压)存在完全缺失情况。等待时间数据完整性最佳,无缺失值。数据经过DuckDB全量分析验证,确保统计准确性。

适用场景

本数据集适用于主题公园运营优化、游客行为分析、天气影响研究、设施维护规划、客流预测建模、收益管理分析等多个应用领域。研究人员可利用该数据集开展机器学习建模、时间序列分析、相关性分析等多种统计分析工作。

packageimg

数据与资源

附加信息

字段
数据集大小 35.56 MiB
最后更新 2025年8月23日
创建于 2025年8月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。