Historikertage_Twitter_Based_2012_2018历史学者会议推文数据

数据集概述

本数据集收录了2012-2018年德国历史学家会议(Historikertage)相关的Twitter数据记录,包含脱水状态ID、用户分类标签及性别信息等,可通过Twitter API恢复完整语料,为研究历史学家会议社交媒体传播特征提供支持。

文件详解

  • 数据文件(CSV格式,共5个):
  • histag_all_dehydrated.csv:基础脱水数据文件,包含status_id(推文ID)、corpus_user_id(语料内部用户ID)、hauptkategorie_1/2(一级分类)、Gender(用户性别)、Nebenkategorie(二级分类)及年度语料归属布尔变量
  • VHDResolution_dehydrated.csv:含status_id、corpus_user_id、Gender字段的脱水数据文件
  • 带prepended-ids的CSV文件(如VHDResolution_dehydrated_prepended-ids.csv):status_id前加"x"的版本,避免科学计数法错误
  • 文档文件(PDF格式,共2个):
  • 20220504_historikertage_twitter_datenreport_v2.pdf:数据报告第二版,包含标注图表、统计分析及方法论说明
  • 20220318_historikertage_twitter_datenreport_v1.pdf:数据报告第一版

适用场景

  • 社交媒体传播研究:分析历史学家会议相关推文的传播规律与用户互动特征
  • 学术社群行为分析:探究历史学者在Twitter平台的内容发布偏好及性别差异
  • 数字人文研究:结合API恢复的完整语料,开展学术会议的网络话语分析
  • 计算社会科学:利用分类标签数据,研究学术事件相关社交媒体文本的主题分类模型构建
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 8.84 MiB
最后更新 2025年12月24日
创建于 2025年12月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。