亚马逊产品评价情感分析与推特情感分析数据集-pypiahmad
数据来源:互联网公开数据
标签:亚马逊,评价分析,情感分析,推特,产品反馈,消费者行为,社交媒体
数据概述:
本数据集包含两个子集:亚马逊产品评价数据集和推特情感分析数据集。亚马逊产品评价数据集收录了3,150条产品评价记录,涵盖产品的评分、评价日期、产品变体以及验证评价文本等信息,旨在分析用户对亚马逊产品的满意度及情感倾向。推特情感分析数据集则包含31,962条推特记录,涵盖推特ID、情感标签及推特文本等信息,用于研究社交媒体上的情感表达和倾向。
亚马逊产品评价数据集字段包括:
- rating: 数值型,评分范围为1至5。
- date: 文本型,包含77个不同日期,最常见的是"30-Jul-18"。
- variation: 文本型,包含16种不同产品变体,其中"Black Dot"最为常见。
- verified_reviews: 文本型,包含2301条不同的验证评价文本。
- feedback: 数值型,二元值(0或1),表示评价的正面或负面情感。
推特情感分析数据集字段包括:
- id: 数值型,每个推特具有唯一ID。
- label: 数值型,二元值(0或1),表示推特的情感标签,均值为0.07,可能表示特定情感类别(如负面情感)的比例。
- tweet: 文本型,包含29,530条不同的推特文本,其中一条推特出现319次,建议进一步清理潜在重复或常见表达。
数据用途概述:
该数据集适用于多个研究与分析场景,包括产品评价分析、消费者满意度研究、社交媒体情感分析、市场趋势监测等。研究人员可利用亚马逊产品评价数据集分析消费者对产品的反馈和情感倾向,帮助企业改进产品和服务;学术机构可利用推特数据集研究社交媒体上的情感表达模式和趋势,为社会科学研究提供数据支持。此外,数据集也适合用于教育培训,帮助学习者掌握数据分析和情感分析技术。