ArguAna_Based_酒店评论情感分析标注语料库_V2

数据集概述

本数据集为ArguAna TripAdvisor酒店评论情感分析语料库,包含2100条情感得分均衡的酒店评论,均被手动标注为事实或正负观点,同时标注了评论中的酒店相关方面。此外还提供近20万条未标注的酒店评论,适用于科学研究用途。

文件详解

  • 标注语料包(含软件)
  • 文件名称:arguana-tripadvisor-annotated-plus-software-v1.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含V1版本的标注酒店评论数据及配套软件,评论已按子句级别分类为事实、正面或负面观点,并标注了酒店相关方面。
  • 标注语料包V2
  • 文件名称:arguana-tripadvisor-annotated-v2.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含V2版本的标注酒店评论数据,采用更易扩展的底层类型系统,XMI文件格式与V1不同,需适配软件才能使用。
  • 未标注语料包V2
  • 文件名称:arguana-tripadvisor-unannotated-v2.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含近20万条未手动标注的酒店评论数据,可用于模型训练等扩展研究。

适用场景

  • 局部情感流研究: 分析酒店评论中的情感流向及变化趋势。
  • 基于方面的情感分析: 针对酒店相关方面(如服务、设施等)进行情感极性判断。
  • 自然语言处理模型训练: 利用标注数据训练情感分类模型,未标注数据可用于半监督或无监督学习。
  • 语料库版本对比研究: 比较V1和V2版本标注体系的差异及对分析结果的影响。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 266.18 MiB
最后更新 2026年2月8日
创建于 2026年2月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。