电商平台用户评论情感与主题分类数据集1963-2021
数据来源:互联网公开数据
标签:用户评论,情感分析,主题分类,电商平台,数据挖掘,机器学习,自然语言处理
数据概述:
本数据集包含来自不同类别产品和零售商的客户评论,涵盖1963年至2021年间的数据。数据集分为训练集和测试集,其中训练集包含6136行14列数据,测试集包含2631行14列数据。数据集旨在用于对未来的评论进行主题分类和情感极性预测。每个评论可能涉及一个或多个主题,包括组件、配送与客户服务、设计与美学、尺寸、功能、价格、质量、可用性等多个方面。评论的整体情感极性被归类为正向或负向。
数据用途概述:
该数据集适用于情感分析、主题分类、用户反馈研究等多种场景。研究者可以利用此数据集进行自然语言处理研究,分析用户对产品和客户服务的反馈;企业可以借此了解用户对产品的具体关注点,优化产品设计和客户服务;电商平台可以利用数据改进用户体验,提高客户满意度。此外,该数据集也适合用于教育培训,帮助学习者掌握数据挖掘和机器学习技术。
举例:
在训练数据集中,一条评论如下:
Id: 1234
Review: 产品包装不错,但安装过程有些困难,客服服务很好。
Components: 0
Delivery and Customer Support: 1
Design and Aesthetics: 1
Dimensions: 0
Features: 0
Functionality: 0
Installation: 1
Material: 0
Price: 0
Quality: 0
Usability: 0
Polarity: 0
这条评论涉及设计与美学、配送与客户服务及安装三个主题,情感极性为负向。