印度零售商品价格预测竞赛数据集-jinxzed
数据来源:互联网公开数据
标签:零售,价格预测,机器学习,回归,数据分析,商品,销售,时间序列,竞赛数据
数据概述:
本数据集是“印度零售商品价格预测竞赛”所使用的数据集,旨在帮助参赛者预测零售商品的单价。数据集包含超过40万条的零售交易记录,涵盖了不同商品类别、销售时间、数量、国家等多个维度的数据。其中,Train.csv包含284780行数据,包含商品的基本信息、购买数量、购买日期、单价等字段,单价为目标变量;Test.csv包含122049行数据,用于测试模型的预测能力。
数据集字段说明:
InvoiceNo:发票编号,已编码
StockCode:商品唯一代码,已编码
Description:商品描述,已编码
Quantity:购买数量
InvoiceDate:购买日期
UnitPrice:商品单价,目标变量
CustomerID:客户唯一标识
Country:销售国家,已编码
数据用途概述:
该数据集主要用于机器学习模型的训练与评估,特别是用于解决多变量回归问题。参赛者可以利用此数据集构建预测模型,预测零售商品的单价,从而提升在零售领域的分析能力。该数据集也适用于数据科学和机器学习的教学,帮助学习者理解如何处理大规模数据集、进行特征工程,以及优化模型性能。