Yelp评论情感分析数据集-2015年-mexwell
数据来源:互联网公开数据
标签:Yelp,评论,情感分析,文本分类,用户评价,评分,数据挑战,数据分析
数据概述:
本数据集来源于2015年Yelp数据挑战赛,包含从Yelp网站收集的评论文本。数据主要用于文本分类任务,通过对评论文本进行分析,预测其对应的情感评分(1至5分之间)。
数据集包含以下字段:
- text:评论文本,使用双引号(")进行转义,内部双引号用两个双引号("")转义,换行符用反斜杠加n(\n)表示。
- label:评论对应的情感评分,取值范围为1到5分。
该数据集由Xiang Zhang、Junbo Zhao和Yann LeCun等人用于字符级卷积神经网络在文本分类中的应用研究,相关成果发表在2015年的神经信息处理系统会议(NIPS 2015)上。
数据用途概述:
该数据集适用于情感分析、文本分类、自然语言处理等研究领域。研究人员可以利用此数据集开发和评估情感分析模型;企业可以利用此数据集优化用户评论分析系统;教育机构可以利用此数据集进行自然语言处理课程的教学和实验。该数据集为相关领域的研究和应用提供了宝贵的数据资源。