Game_of_Spoilers_剧透检测推文标注数据2015_06

数据集概述

本数据集为论文"Game of Spoilers"(剧透游戏)研究项目所使用的Twitter数据,包含截至2015年6月14日收集的推文内容。数据经过筛选,仅保留与"livro"(书籍)和"livros"(书籍,复数)相关的推文,主要用于社交媒体中的剧透内容检测研究。数据集包含数据与标签的划分,适合用于文本分类模型的训练和评估。

文件详解

  • 文件名称: spoiler-until2015-06-14-filtro-livro-AND-livros.xlsx
  • 文件格式: XLSX
  • 字段映射介绍: 作为包含数据与标签划分的数据文件,通常包含推文文本内容以及对应的剧透/非剧透标签信息,可能涉及推文ID、发布时间、文本内容、标注类别等字段。

数据来源

论文"Game of Spoilers"

适用场景

  • 社交媒体文本分类: 用于训练和评估模型自动识别Twitter等社交媒体平台上的剧透内容。
  • 自然语言处理研究: 作为特定领域(书籍剧透)的文本分类数据集,支持情感分析、关键词提取等相关NLP任务研究。
  • 信息过滤技术开发: 为开发能够自动过滤敏感信息或剧透内容的信息过滤系统提供数据支持。
  • 数字人文研究: 分析社交媒体用户在书籍相关话题下的讨论模式和内容传播特点。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.05 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。