Twitter交通信息系统开发用带交通标签推文数据集

数据集概述

本数据集包含通过Twitter搜索API收集的推文,每条推文被标注为非交通(NT)、交通事件(TI)、交通状况与信息(TCI)三类,同时提供交通相关(TI+TCI)与非相关(NT)的二分类版本,支持交通信息系统的开发。

文件详解

  • 3分类数据集文件:
  • 1_TrainingSet_3Class.csv:CSV格式,包含三列,分别为推文类别编号(0=NT、1=TI、2=TCI)、需移除开头's'的推文ID、推文文本
  • 1_TestSet_3Class.csv:CSV格式,字段与训练集一致
  • 2分类数据集文件:
  • 1_TrainingSet_2Class.csv:CSV格式,将推文分为交通相关(TI+TCI)和非交通相关(NT)两类
  • 1_TestSet_2Class.csv:CSV格式,字段与二分类训练集一致

适用场景

  • 交通信息系统开发:训练实时交通事件检测与状态更新模型
  • 智能交通研究:分析社交媒体中交通事件与路况信息的传播规律
  • 自然语言处理应用:构建交通领域文本分类与信息提取算法
  • 城市交通管理:辅助交通部门实时掌握路网异常事件与通行状态
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.11 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。