数据内容
数据集由一个CSV文件组成,共包含1000条记录和16个字段。每条记录代表一个时间点下的物流事件,涵盖全球随机位置的资产信息。库存水平范围从100到500,平均约298;用户交易金额范围从100到500,平均约299;资产利用率范围从60到100,平均约80。整体缺失率约为1.64%,主要集中在延迟原因字段,其他字段完整性高。
字段定义
数据集包含以下核心字段类别:
- 时间信息: 时间戳(Timestamp),覆盖2024年全年
- 资产信息: 资产ID(Asset_ID,包括10种卡车型号)、纬度(Latitude)、经度(Longitude)、资产利用率(Asset_Utilization)
- 库存与需求: 库存水平(Inventory_Level)、需求预测(Demand_Forecast)
- 发货与物流: 发货状态(Shipment_Status,包括延迟、交付、在途三种)、物流延迟(Logistics_Delay,二元标识)、物流延迟原因(Logistics_Delay_Reason,包括天气、交通、机械故障三种)
- 环境因素: 温度(Temperature)、湿度(Humidity)
- 交通与等待: 交通状态(Traffic_Status,包括拥堵、畅通、绕行三种)、等待时间(Waiting_Time)
- 用户行为: 用户交易金额(User_Transaction_Amount)、用户购买频率(User_Purchase_Frequency,包括1至10种频率水平)
数据特征
资产ID分布较为均衡,10种卡车型号各占比约9%至11%,体现了多样化的物流资产覆盖。发货状态包括延迟、交付和在途三种,占比分别约35%、34%和31%,提供了平衡的物流事件样本。交通状态同样均衡分布于拥堵、畅通和绕行,占比约33%至35%。时间跨度覆盖2024年全年364天,确保了连续性和季节性分析潜力。数值字段如库存水平、交易金额和资产利用率跨度合理,平均值稳定,数据完整性高,支持可靠的统计分析和建模。
适用场景
本数据集适用于以下分析与应用场景:
- 物流延迟预测: 构建模型分析延迟原因及其对供应链的影响
- 库存优化: 评估库存水平与需求预测的匹配度以提升管理效率
- 资产利用分析: 研究资产利用率与位置、交通状态的关联
- 用户行为研究: 考察购买频率和交易金额对物流需求的影响
- 环境因素影响评估: 分析温度和湿度对发货状态的潜在作用
- 交通模拟: 模拟交通状态和等待时间对整体物流效率的冲击
- 预测建模: 基于历史数据开发需求和延迟预测算法