亚马逊电子产品用户评价情感分析数据集-2018年

亚马逊电子产品用户评价情感分析数据集-2018年 数据来源:互联网公开数据 标签:亚马逊,电子产品,用户评价,情感分析,文本挖掘,评分,评论,NLP,自然语言处理 数据概述: 本数据集是亚马逊2018年电子产品评论数据集的子集,包含了用户对电子产品的评价信息。为了保证数据的质量和可用性,数据集经过筛选,仅保留了5-core数据,即每位用户和每个产品至少有5条评论。数据包含评论文本、评分、评价时间等关键信息。

数据字段包括:

overall:产品评分(1到5星) vote:评论的有用投票数量 reviewText:评论的文本内容 summary:评论的摘要 reviewTime:评论时间(原始格式) 数据来源: 原始数据来自于Amazon Review Data (2018),该数据集是2014年发布的亚马逊评论数据集的更新版本。

原始论文: Justifying recommendations using distantly-labeled reviews and fined-grained aspects Jianmo Ni, Jiacheng Li, Julian McAuley Empirical Methods in Natural Language Processing (EMNLP), 2019

数据用途概述: 该数据集适用于多种自然语言处理(NLP)和情感分析任务。研究人员可以利用此数据进行情感分析,预测用户对产品的态度;可以进行文本挖掘,提取用户评价中的关键信息;还可以用于构建推荐系统,根据用户评论推荐产品。此外,该数据集也适合用于NLP教学,帮助学习者理解文本数据的处理和分析。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 279.45 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。