数据集概述
本数据集包含两类时间网络数据:一是基于多种结构机制生成的合成时间网络数据,二是提取自曼哈顿黄色出租车行程记录的真实世界时间网络数据,用于时间网络结构变化点检测研究。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 真实数据分析目录(Real Data Analysis- Manhattan yellow taxi trip records/):
- real-data.ipynb:Jupyter Notebook格式,用于曼哈顿黄色出租车行程记录的真实数据分析
- real-data-iNzV85.ipynb:Jupyter Notebook格式,用于曼哈顿黄色出租车行程记录的真实数据分析
- yellow_tripdata_2014-04.parquet:Parquet格式,存储2014年4月曼哈顿黄色出租车行程记录的真实数据
- 合成数据模拟目录(Synthetic Data Simulation/):
- Synthetic Data Simulation.zip:压缩包格式,包含基于随机块模型、独立对模型、Erdős–Rényi网络等机制生成的合成时间网络数据
适用场景
- 时间网络分析:研究时间网络中结构变化点的检测方法
- 交通数据分析:分析曼哈顿出租车出行网络的时间动态变化
- 机器学习应用:验证基于MDL引导张量分解的变化点检测算法性能
- 合成数据研究:评估不同结构机制下时间网络模型的模拟效果