-
意大利Twitter回声室起源数据集2020欧洲杯
2025年12月20日 30 209 118
数据集概述 该数据集聚焦2020欧洲杯期间意大利Twitter平台上BLM/种族主义话题的讨论,通过多拓扑层面分析回声室的起源与演变,关联其形成与特定事件的关系,包含推文、用户立场等数据及相关文档。 文件详解 数据文件(JSON格式): hashtags_classification.json:标签分类数据,可能包含话题标签的分类结果...
-
Twitter气候变化标签与关键词数据集
2025年12月20日 30 55 46
数据集概述 该数据集收集了Twitter平台上与气候变化相关的标签和关键词,分为支持与意识类、批判与怀疑类、两党气候类三大类别,覆盖带标签和无标签关键词,经清洗后确保数据准确性,为社交媒体话语分析提供结构化数据支持。 文件详解 文件名称:Climate Change Hashtags and Keywords on Twitter.pdf...
-
Twitter平台攻击与欺凌行为检测数据集
2025年12月19日 30 11 6
数据集概述 该数据集围绕Twitter平台的攻击与欺凌行为检测展开,包含160万条推文数据,覆盖3个月时间范围。数据支持提取文本、用户及网络属性,用于研究欺凌者与攻击者的特征差异,为相关机器学习分类模型提供训练与评估基础。 文件详解 文件名称: websci_dataset.zip 文件格式: ZIP压缩包 内容说明:...
-
大学网络影响力的Twitter超链接网络计量指标补充材料
2025年12月19日 30 141 70
数据集概述 本数据集为补充材料,聚焦Twitter嵌入超链接作为网络计量指标的应用,分析其衡量大学网络影响力的可行性。通过Topsy工具采集200所大学相关含链接推文,对比MajesticSEO、OpenSiteExplorer等来源数据,开展统计检验与预测模型分析,为网络计量研究提供实证数据支持。 文件详解...
-
科学社会互联价值创造模型组件与原型数据集
2025年12月14日 30 158 43
数据集概述 本数据集是研究《科学社会互联的价值创造模型:组件与原型》的配套资料,包含论文支撑信息、研究主题标题文本及原型分析结构化数据,为探索科学领域与社会互联的价值创造模式提供数据支持。 文件详解 文件名称: supplement_information.pdf 文件格式: PDF 内容说明:...
-
Twitter_API_Based_Twitter_Political_Polarization_2010_选举前推文网络完整数据
2025年12月13日 30 123 36
数据集概述 该数据集是用于生成2011年ICWSM会议论文《Political Polarization on Twitter》结果的训练数据,包含2010年国会中期选举前六周内,通过Twitter流API采样的公共推文构建的三个Twitter用户间政治传播网络。 文件详解 文件名称: LICENSE.CC-BY-NC-ND-4.0.txt 文件格式:...
-
莱里达省图书馆社交媒体数据集2020
2025年12月12日 30 101 26
数据集概述 本数据集记录了2020年2月收集的西班牙莱里达省各图书馆的社交媒体账号信息,包含多个行政区的图书馆在Twitter、Facebook等主流社交平台的账号数据,为研究图书馆数字化服务渠道分布提供基础资料。 文件详解...
-
Twitter与Facebook数据挖掘及情感分析数据集
2025年12月11日 30 139 90
数据集概述 本数据集围绕Twitter与Facebook平台的数据挖掘及情感分析主题构建,包含从Google Scholar获取的相关学术文献元数据,涵盖文献标题、作者、发表年份、被引次数等核心信息,为该领域研究提供文献基础数据。 文件详解 数据集核心文件:...
-
气候安全相关推文ID数据集2014_2022
2025年12月10日 30 14 12
数据集概述 本数据集包含2014年1月至2022年3月期间,Twitter平台上反映气候安全对话的推文ID。数据集由3个文件组成,涵盖推文ID列表、查询说明及文档,为研究气候安全议题在社交媒体上的传播提供数据支持。 文件详解 文件名称: cs_tweets_ids.txt 文件格式: TXT 字段映射:...
-
股票标签搭载数据集_2017
2025年12月10日 30 9 4
数据集概述 本数据集包含2017年5月至9月期间约九百万条提及美国主要市场股票标签的Twitter推文数据(含用户机器人分类标签),以及约三万家相关公司的金融信息,为研究股票微博中的垃圾信息与机器人活动提供支持。 文件详解 READ.ME: .me格式,可能包含数据集说明文档 entities.csv.zip: CSV压缩文件,可能包含实体相关数据...
-
Webis标题党破解语料库2022
2025年12月9日 30 70 21
数据集概述 该数据集包含从Facebook、Reddit和Twitter爬取的五千条标题党帖子及其对应的破解内容,按训练、验证、测试集划分。破解内容分为短语型、段落型和非连续多文本型三类,曾用于SemEval-2023标题党破解任务。 文件详解 文件名称: webis-clickbait-22.zip 文件格式: ZIP压缩包 内部文件(按预设划分):...
-
Twitter仇恨言论检测与分析数据集
2025年12月8日 30 162 97
数据集概述 该数据集包含用于Twitter仇恨言论检测与分析研究的两个语料库:2017年2月至12月收集的200万条原始推文,以及6000条标注是否包含仇恨内容的推文,为相关研究提供数据支持。 文件详解 文件名称:labeled_corpus_6K.txt 文件格式:TXT(.txt)...
-
加泰罗尼亚公共图书馆社交媒体与博客档案数据集2020年4月
2025年12月7日 30 128 109
数据集概述 本数据集包含2020年4月更新的加泰罗尼亚公共图书馆社交媒体及博客档案信息,覆盖图书馆、阅读空间、服务点、流动图书馆等共五百零七个服务点,记录其社交媒体账号及博客链接等信息。 文件详解 数据文件(三种格式):...
-
视觉虚假信息数据集
2025年12月7日 30 127 28
数据集概述 该数据集是针对宣传、谣言和假新闻三类视觉虚假信息的精选数据集,包含描述文档和图片链接文件,为视觉虚假信息的识别与分析提供数据支持。 文件详解 文件名称: Dataset description.pdf 文件格式: PDF 内容说明: 详细记录数据集的来源信息及相关背景介绍 文件名称: Sources.xlsx 文件格式: XLSX...
-
Twitter公民科学社区可持续发展目标与电子健康分析数据集
2025年12月6日 30 191 19
数据集概述 该数据集包含对Twitter公民科学社区中可持续发展目标(SDGs)、电子学习及电子健康讨论的分析结果,为复现相关研究成果提供基础。数据经匿名处理,不含个人隐私信息,涵盖主题分布、话题网络、高频标签及用户互动等多维度分析内容。 文件详解 可持续发展目标(SDGs)分析文件:...
-
CMU_MisCov19新冠疫情Twitter错误信息特征数据集
2025年12月6日 30 196 163
数据集概述 该数据集为针对新冠疫情相关Twitter错误信息的标注数据集,包含四千五百七十三条标注推文,覆盖十七个主题,同时提供标注编码手册,用于错误信息检测与特征分析研究。 文件详解 文件名称:COVID_19_Twitter_Misinformation_Codebook.pdf 文件格式:PDF...
-
社交媒体气候安全原始与处理数据集2014_2023
2025年12月5日 30 204 160
数据集概述 本数据集涵盖2014年1月至2023年5月期间Twitter平台上与气候安全相关的对话数据,包含原始及处理后的多类型文件,为研究社交媒体中气候安全议题的传播提供支持。 文件详解 文档与说明文件: readme.pdf:PDF格式,提供数据集相关说明文档...
-
精英Twitter极化数据集2010_2021
2025年12月5日 30 201 185
数据集概述 本数据集包含2010年1月1日至2021年12月31日期间9位全球知名公众人物的Twitter活动标注数据,涵盖原创推文和转推,包含情感评分、极化分类及主题分配等信息,覆盖政治、商业、体育等多元领域。 文件详解 该数据集以压缩包形式存储,按人物划分目录,每个目录包含两个Excel文件,具体说明如下: - 压缩包文件:Elite...
-
西班牙主要政党Twitter毒性水平分析数据集2015_2023
2025年12月5日 30 158 26
数据集概述 该数据集聚焦2015至2023年西班牙主要政党在Twitter平台的内容分析,核心为各政党相关推文的毒性水平研究,提供该主题的研究材料压缩包。 文件详解 文件名称:Analizando los niveles de toxicidad de los principales partidos politicos españoles en...
-
西班牙与葡萄牙八座山地公园社交媒体数据集2015_2022
2025年12月4日 30 45 15
数据集概述 本数据集包含2015至2022年间从Flickr和Twitter/X平台获取的八座西班牙与葡萄牙山地国家公园的地理标记照片及元数据,经人工智能模型和专家标注处理,为相关研究提供基础数据支持。 文件详解 数据库元数据文件:...



