Shopify电商商店描述与分类数据集

Shopify电商商店描述与分类数据集 数据来源:互联网公开数据 标签:Shopify,电商,商店,NLP,文本分析,分类,半监督学习,多标签分类,网页抓取 数据概述: 本数据集包含了61.8万个Shopify在线商店的信息。对于每个商店,我们提供了其标题、描述以及商品集合列表,这些数据均从商店的HTML主页中抓取获得(详见 shopgram.io 博客文章了解数据收集方法)。通过使用基本的自然语言处理(NLP)方法,例如词形还原,我们为每个商店提供了一些标签,然而,由于不确定性或非英语语言等原因,许多商店没有标签。因此,该数据集特别适用于半监督多标签分类任务。 数据用途概述: 该数据集适用于电商商店的分类与聚类分析,以及自然语言处理相关研究。研究人员可以利用该数据进行半监督学习,开发多标签分类模型,例如根据商店描述预测其所属行业或产品类别。此外,该数据集也适合用于探索电商商店的文本特征,分析商店描述与商品销售之间的关系。同时,该数据集也可用于构建电商推荐系统,分析用户行为,进行个性化推荐。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 114.09 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。