X网络威胁情绪分析数据集2025

数据集概述

该数据集包含约503,456条X平台(原Twitter)推文,主要语言为英语、西班牙语和法语,时间范围覆盖2024年8月至2025年3月。数据聚焦网络安全威胁相关公众话语,记录推文内容、互动数据及用户基础信息,用于情绪分析研究。

文件详解

  • 文件名称:twitter_sentiment_dataset.csv
  • 文件格式:CSV(UTF-8编码)
  • 核心字段:
  • id:推文唯一标识
  • text:原始推文内容
  • cleaned_text:清洗后的文本
  • created_at:推文发布时间
  • username/user_id:用户信息
  • language:推文语言
  • retweet_count/like_count等:互动数据
  • hashtags/mentions/urls:推文关联元素
  • source:发布来源
  • is_retweet/is_reply:推文类型标识

适用场景

  • 网络安全公众情绪研究:分析不同地区用户对网络威胁的情绪倾向
  • 社交媒体话语分析:探究网络安全话题在X平台的传播特征
  • 多语言NLP模型训练:用于网络安全领域多语言情绪分类模型开发
  • 威胁传播趋势监测:结合时间维度分析网络威胁相关话题的热度变化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 62.3 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。