数据集概述
本数据集收录了2012-2018年德国历史学家会议(Historikertage)相关的Twitter数据记录,包含脱水状态ID、用户分类标签及性别信息等,可通过Twitter API恢复完整语料,为研究历史学家会议社交媒体传播特征提供支持。
文件详解
- 数据文件(CSV格式,共5个):
- histag_all_dehydrated.csv:基础脱水数据文件,包含status_id(推文ID)、corpus_user_id(语料内部用户ID)、hauptkategorie_1/2(一级分类)、Gender(用户性别)、Nebenkategorie(二级分类)及年度语料归属布尔变量
- VHDResolution_dehydrated.csv:含status_id、corpus_user_id、Gender字段的脱水数据文件
- 带prepended-ids的CSV文件(如VHDResolution_dehydrated_prepended-ids.csv):status_id前加"x"的版本,避免科学计数法错误
- 文档文件(PDF格式,共2个):
- 20220504_historikertage_twitter_datenreport_v2.pdf:数据报告第二版,包含标注图表、统计分析及方法论说明
- 20220318_historikertage_twitter_datenreport_v1.pdf:数据报告第一版
适用场景
- 社交媒体传播研究:分析历史学家会议相关推文的传播规律与用户互动特征
- 学术社群行为分析:探究历史学者在Twitter平台的内容发布偏好及性别差异
- 数字人文研究:结合API恢复的完整语料,开展学术会议的网络话语分析
- 计算社会科学:利用分类标签数据,研究学术事件相关社交媒体文本的主题分类模型构建