Shopee预处理数据集

Shopee预处理数据集 数据来源:互联网公开数据
标签:Shopee,电商,图像识别,数据预处理,商品分类,2021 Kaggle竞赛
数据概述:
本数据集是2021年Kaggle竞赛“Shopee”所使用的预处理数据。原始数据集包含Shopee电商平台上的商品信息,包括商品标题、描述、图像以及分类标签等字段。经过预处理后,数据集针对竞赛任务进行了优化,主要处理包括图像特征提取、文本信息清洗、类别标签标准化等操作。数据集包含约50万条商品记录,覆盖多个商品类别,适合用于图像识别、文本分析和商品分类等任务。
数据用途概述:
该数据集适用于多种场景,包括但不限于:
1. 图像识别模型训练,如商品分类、相似商品推荐等。
2. 文本分析任务,如商品标题关键词提取、语义分析等。
3. 多模态数据融合研究,结合图像和文本信息进行商品推荐或分类。
4. 数据预处理方法研究,探索不同预处理策略对模型性能的影响。
此外,该数据集也可用于教学场景,帮助学习者理解电商数据的特性及预处理流程。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 142.19 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。