HM个性化时尚推荐顾客竞赛数据集
数据来源:互联网公开数据 (H&M个性化时尚推荐竞赛)
标签:零售数据,客户数据,用户画像,个性化推荐,冷启动,数据分析,机器学习,时尚推荐,客户行为,电商
数据概述:
本数据集包含了H&M个性化时尚推荐竞赛测试数据集中顾客的元数据信息。 这些信息包括用户的活跃状态、冷启动状态以及在2020年的交易行为,可以帮助分析师和机器学习工程师更好地了解客户特征,构建更精准的推荐模型。
该数据集旨在为混合推荐方法提供数据支持。 例如,可以使用深度学习模型为活跃且非冷启动用户生成推荐,而对其他用户使用基于趋势的推荐。
数据集包含以下列:
Customer_id: 测试集中的所有客户ID
num_missing_months: 用户在2020年没有任何交易的月份数
lastest_inactive_months: 用户在测试集中重新出现之前连续不活跃的月份数
active_status: 活跃状态,分为以下几类:
active: 用户在2020年9月有交易(出现在训练数据中)
inactive_in_year: 用户在2020年没有任何交易
inactive_in_3_months_or_more: 用户在2020年7月、8月、9月没有任何交易
inactive_in_2_months: 用户在2020年8月、9月没有任何交易
inactive_in_1_months: 用户在2020年9月没有任何交易
num_transactions: 用户在2020年的交易次数
cold_start_status: 冷启动状态,分为以下几类:
cold_start: 用户在2020年的交易次数 10
mean_transactions_in_active_month: 用户活跃月份的平均交易次数
数据用途概述:
该数据集适用于客户细分、用户画像构建、推荐系统优化等多种场景。 电商平台可以利用此数据分析客户的购买行为,识别活跃客户和潜在客户;推荐系统工程师可以构建混合推荐模型,为不同类型的客户提供个性化的推荐服务。 本数据集为提高推荐系统的准确性和用户满意度提供了有价值的数据资源。 (更多关于数据的信息,请参考笔记本:https://www.kaggle.com/astrung/eda-extract-user-metadata-to-apply-deep-model/notebook)