Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea

Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea 数据来源:互联网公开数据 标签:Medium,应用评论,用户反馈,情感分析,订阅,内容,界面,用户体验,roBERTa,自然语言处理,文本分类

数据概述: 本数据集包含了从Google Play商店抓取的Medium应用的用户评论数据。数据抓取使用google_play_scraper库,筛选出英语评论,并收集了所有评论内容。为了进行情感分析和分类,数据集经过了人工标注和模型训练。

数据经过人工标注,分为四个类别:

订阅(Subscription):用户对Medium订阅服务的评价。 内容(Content):用户对Medium平台上文章内容的评价,包括主题多样性和质量。 界面(Interface):用户对应用的用户界面、搜索功能、推荐系统以及支付相关问题的评价。 用户体验(User Experience):用户对应用的总体感受和评价,不属于上述任何一类的抽象评价。 使用约350条样本数据对roBERTa模型进行了微调,用于分类评论。随后,使用同一模型进行情感分析(未进行微调)。

数据收集和处理的详细信息,请参考Kaggle Notebook:https://www.kaggle.com/code/raqhea/automatically-collect-process-and-label-text-data

情感分析模型基于:https://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment

数据用途概述: 该数据集可用于多种用途,包括:

情感分析:分析用户对Medium应用的整体情感倾向。 用户反馈分析:了解用户对应用不同方面的具体评价,如订阅服务、内容质量、界面设计等。 产品改进:帮助开发者和产品经理了解用户需求,进行针对性的产品优化。 市场调研:用于市场调研,了解用户对Medium平台的看法和态度。 自然语言处理研究:为自然语言处理研究提供数据,例如文本分类、情感分析等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.63 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。