销售预测挑战赛数据集-2022年1月

销售预测挑战赛数据集-2022年1月 数据来源:互联网公开数据 标签:销售预测,时间序列,零售,商品销售,国家,商店,商品,预测,机器学习,竞赛

数据概述: 本数据集是Kaggle Tabular Playground Series 1月竞赛的完整复刻,旨在为数据科学家和机器学习爱好者提供一个用于实验和学习的平台。数据集模拟了真实世界的销售数据,包含来自三个国家、两个商店的三个商品在一年内的销售情况。数据中包含了各种影响因素,如周末效应、节假日效应和季节性波动等,为探索不同的建模方法提供了丰富的机会。

数据文件包括:

train.csv:训练集,包含每个日期-国家-商店-商品的销售数据。 test.csv:测试集,用于预测每个日期-国家-商店-商品的销售量。请注意,公开排行榜基于测试集的第一季度数据进行评分,而私有排行榜基于剩余的数据进行评分。 sample_submission.csv:一个符合提交格式的示例提交文件。

数据用途概述: 该数据集主要用于销售预测建模、时间序列分析和机器学习实践。用户可以利用此数据进行销售额预测,探索不同的预测模型,例如时间序列模型(ARIMA、Prophet等)、机器学习模型(XGBoost、LightGBM等)以及深度学习模型。此外,该数据集也适用于探索特征工程、模型评估和调优等实践,帮助用户提升在实际销售预测问题上的技能。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.22 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。