eBay商品评论情感分析数据集

eBay商品评论情感分析数据集

数据来源:互联网公开数据

标签:eBay,商品评论,情感分析,文本数据,评分,机器学习,自然语言处理

数据概述: 本数据集由作者通过Python网络爬虫脚本从eBay网站抓取,旨在用于情感分析模型的构建。数据集包含两个文件:

ebay_reviews.csv:原始数据集,包含四个字段:商品类别(如耳机、手机等)、评论标题、评论内容、评分。评分是数值型,取值范围为1到5,其中1表示最差评价,5表示最佳评价。原始数据未经清洗,需要进行预处理才能用于模型构建。

ebay_reviews_cleaned.csv:经过预处理后的数据集,适用于机器学习算法。包含两个字段:评分和清洗后的评论文本。评分字段将原始评分转化为三个类别:-1(对应评分1和2,表示负面评价)、0(对应评分3,表示中性评价)、1(对应评分4和5,表示正面评价)。第二个字段是经过清洗的评论标题和内容的合并。

数据用途概述: 该数据集主要用于情感分析模型的训练和评估。 研究人员可以使用该数据进行文本情感分类,预测用户对商品的评价。 此外,该数据集还可用于探索不同商品类别的情感分布,分析评论文本特征,以及进行自然语言处理相关研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 5.72 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。