Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea
数据来源:互联网公开数据
标签:Medium,应用评论,用户反馈,情感分析,订阅,内容,界面,用户体验,roBERTa,自然语言处理,文本分类
数据概述:
本数据集包含了从Google Play商店抓取的Medium应用的用户评论数据。数据抓取使用google_play_scraper库,筛选出英语评论,并收集了所有评论内容。为了进行情感分析和分类,数据集经过了人工标注和模型训练。
数据经过人工标注,分为四个类别:
订阅(Subscription):用户对Medium订阅服务的评价。
内容(Content):用户对Medium平台上文章内容的评价,包括主题多样性和质量。
界面(Interface):用户对应用的用户界面、搜索功能、推荐系统以及支付相关问题的评价。
用户体验(User Experience):用户对应用的总体感受和评价,不属于上述任何一类的抽象评价。
使用约350条样本数据对roBERTa模型进行了微调,用于分类评论。随后,使用同一模型进行情感分析(未进行微调)。
数据收集和处理的详细信息,请参考Kaggle Notebook:https://www.kaggle.com/code/raqhea/automatically-collect-process-and-label-text-data
情感分析模型基于:https://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment
数据用途概述:
该数据集可用于多种用途,包括:
情感分析:分析用户对Medium应用的整体情感倾向。
用户反馈分析:了解用户对应用不同方面的具体评价,如订阅服务、内容质量、界面设计等。
产品改进:帮助开发者和产品经理了解用户需求,进行针对性的产品优化。
市场调研:用于市场调研,了解用户对Medium平台的看法和态度。
自然语言处理研究:为自然语言处理研究提供数据,例如文本分类、情感分析等。