Zomato_PT_EN双语餐厅评论完整数据集2014_2022

数据集概述

本数据集包含Zomato葡萄牙平台(现为Dig-In)从2014年4月1日至2022年9月2日期间收集的餐厅评论数据。总计约119万条记录,其中包含约50万条葡萄牙语评论和2.4万条英语评论。数据涵盖餐厅基本信息、用户评分(1-5星)及评论内容,部分条目提供文本评论。数据集还包含通过Google Translate Python API进行语言检测和翻译后新增的字段。

文件详解

  • 文件名称: PT-EN Zomato Dataset.zip
  • 文件格式: ZIP压缩文件
  • 字段映射介绍: 数据集包含以下主要字段:
  • 评论信息:review_id(评论ID)、text(评论文本)、rating(评分)、created_at(创建时间)、text_language(文本语言)、text_translation_pt(葡萄牙语翻译)、text_translation_en(英语翻译)
  • 用户信息:user_pt_id(葡萄牙用户ID)、user_pt_name(葡萄牙用户名)、user_in_id(国际用户ID)、user_in_name(国际用户名)
  • 餐厅信息:res_id(餐厅ID)、res_name(餐厅名称)、res_location(位置)、res_rating(餐厅评分)、res_price(价格)、res_lat(纬度)、res_lng(经度)、res_address_full(完整地址)、res_address_city(所在城市)
  • 餐厅详情:res_about(餐厅简介)、res_group_name(集团名称)、res_group_type(集团类型)、res_kitchen_Types(菜系类型)、res_delivery_Methods(配送方式)

数据来源

Zomato葡萄牙平台(现为Dig-In)

适用场景

  • 多语言情感分析:利用葡萄牙语和英语评论数据,研究不同语言用户的评价情感倾向和表达差异。
  • 餐饮行业用户行为研究:分析用户评分分布、评论频率、时间趋势等消费行为特征。
  • 餐厅服务质量评估:基于用户评分和评论内容,评估餐厅的服务质量、菜品口味和整体体验。
  • 机器翻译质量评估:对比原始评论与机器翻译结果,评估翻译准确性和自然度。
  • 地理位置与餐饮偏好分析:结合餐厅经纬度信息,研究不同地区用户的餐饮偏好和消费习惯。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 244.26 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。