Uber和Ola用户评价数据分析数据集-全球范围-2024
数据来源:互联网公开数据
标签:Uber,Ola,用户评价,评论分析,出行服务,情感分析,用户体验,评分,市场调研,移动应用
数据概述:
本数据集收录了来自Google Play商店的Uber和Ola两款打车服务的用户评价数据,旨在分析用户对这两款共享出行应用的体验和反馈。数据包含了用户评价的各种属性,如评价ID、用户名、评价标题、评价内容、评分、点赞数、评价日期、开发者回复、开发者回复日期、应用版本、语言代码和国家代码等。数据集是分析用户情感、趋势和影响用户满意度的关键因素的宝贵资源。
字段说明:
review_id:每条评价的唯一标识符。
user_name:与评价相关的用户名。
review_title:评价的标题。
review_description:用户提供的评价的主要内容。
rating:用户对应用的评分(例如,1到5分)。
thumbs_up:其他用户为此评价点赞的数量。
review_date:评价发布的日期。
developer_response:应用开发者对评价的任何回复。
developer_response_date:开发者回复的日期。
appVersion:提交评价时的应用版本。
language_code:表示评价语言的代码。
country_code:表示用户所在国家/地区的代码。
数据预处理步骤:
缺失值处理:删除关键列中存在缺失值的行,以确保数据完整性。
文本清洗:将review_title和review_description中的文本数据转换为小写,并删除特殊字符、标点符号和多余的空格。
评分标准化:将评分缩放到统一的0-10分制,以便更好地进行比较。
日期解析:将review_date和developer_response_date中的日期解析为标准格式。
类别编码:对类别变量(appVersion、language_code、country_code)进行独热编码,以便分析。
情感分析:对review_description进行情感分析,将评价分为积极😀、消极😞或中性😐。
特征工程:创建了一个新特征,指示是否存在开发者回复,用于进一步分析。
潜在应用场景:
情感分析:通过对评价进行情感分析,了解用户对Uber和Ola的情感。
评分分析:分析评分分布和用户满意度的趋势。
热门用户:根据评价数量和点赞数识别有影响力的用户。
开发者回复的影响:调查开发者回复是否影响用户满意度。
功能需求分析:分析重复出现的关键词,以识别常见的功能需求。
地域洞察:探索不同国家/地区的用户情感和评分。
应用版本分析:根据不同的应用版本研究用户情感。
用户体验趋势:从评价标题和描述中重复出现的关键词中提取见解。