-
ArabicNewscredibility_Based_Twitter阿拉伯新闻可信度评估数据集
数据集概述 本数据集包含阿拉伯语Twitter新闻可信度评估相关的数据集、模型代码及说明文档。核心内容为基于情感分析和集成学习构建的新闻可信度模型,提供了带特征的新闻数据集、标注回复数据、推文ID列表及模型实现代码,可用于研究Twitter平台阿拉伯新闻的可信度评估方法。 文件详解 数据文件...
-
Trump_Tweets_Based政治话语分析_fake_news_样本数据集2017_2021
数据集概述 本数据集是论文研究使用的样本,包含2017年至2021年间特朗普提及“fake news”的推文数据,用于分析其社交媒体中的政治话语策略,支撑关于去中介化和虚假信息作为政治策略的研究,共包含一个JSON格式文件。 文件详解 文件名称:Dataset - Trump tweets mentioning 'fake news'...
-
BalotajeArgentina2015_SentimientoTweets_社交媒体情感分析数据
数据集概述 本数据集基于阿根廷2015年总统决选期间的Twitter推文情感分析,通过自然语言处理技术提取用户对总统候选人的态度倾向,可用于预测选民投票意向。数据由Kunan公司提供,包含3个压缩文件,覆盖推文内容、情感分析结果及用户定位信息。 文件详解 情感分析结果文件: 文件名称:sentimientos.txt.zip 文件格式:TXT(压缩包)...
-
ScienceCommunication_GermanCommunitySurvey_从业者调查数据集
数据集概述 本数据集包含德国科学传播从业者(N=109)的匿名在线调查结果,涵盖科学传播的格式、目标、受众群体,以及评估相关的经验与认知。调查于2019年11月26日至12月26日开展,采用目的性抽样,通过通讯、邮件列表、会议及Twitter渠道招募参与者,含22个问题(含多选、李克特量表及开放式问题)。 文件详解...
-
Twitter_Online_Public_Shaming_Twitter网络公开羞辱事件推文ID数据集
数据集概述 本数据集包含Twitter平台上多起公开羞辱事件的推文ID,分为约87万条未标记数据和1227条标记数据,共4个文件。数据集涵盖事件描述、标记与未标记推文ID,可用于网络公开羞辱行为的检测、分析与缓解研究。 文件详解 README 文件格式:无扩展名 字段映射介绍:包含数据集概述及各文件说明 shaming-events-...
-
Dia_Pol_Based_BlackLivesMatter和MeToo英文推文数据集_2020_2021
数据集概述 本数据集包含2020年1月1日至2021年12月31日期间,通过Twitter API以“#blacklivesmatter”为查询词提取的258609条英文推文数据,以及对应的采集脚本,整体用于社交媒体话题研究。 文件详解 推文ID列表文件: 文件名称:tweets_id_list.json 文件格式:JSON...
-
Debates_Eleitorais_2014_Based_巴西总统选举辩论Twitter表情包图像数据集
数据集概述 本数据集包含2014年巴西主要电视台播出总统选举辩论期间,通过Twicsy应用从Twitter收集的表情包图像压缩文件,共8个文件,记录了不同辩论场次、电视台对应的社交媒体表情包内容。 文件详解 文件名称:TURNO2_DEB_RECORD_19102014.zip 文件格式:ZIP...
-
基于社交媒体评论的丹南塔拉_Danantara_与免费营养餐_Makan_Bergizi_Gratis_项目数据
数据集概述 本数据集包含X与Twitter平台上关于"Danantara"和"Makan Bergizi Gratis"的社交媒体评论内容,以单一Excel文件形式存储,未进行训练测试、数据标签或原始处理数据的拆分,是研究相关话题网络讨论的基础素材。 文件详解 文件名称:Social_Media_Comments.xlsx 文件格式:XLSX...
-
Shopee与Tokopedia在Twitter的帖子数据集
数据集概述 该数据集包含Shopee与Tokopedia在Twitter平台的帖子相关数据,以PDF格式文件存储,共包含两个文档文件,为研究两大电商平台在社交媒体的内容呈现提供基础数据支持。 文件详解 文件名称:Data Tokopedia.pdf 文件格式:PDF 内容说明:包含Tokopedia在Twitter平台的帖子相关数据文档...
-
意大利Twitter回声室起源数据集2020欧洲杯
数据集概述 该数据集聚焦2020欧洲杯期间意大利Twitter平台上BLM/种族主义话题的讨论,通过多拓扑层面分析回声室的起源与演变,关联其形成与特定事件的关系,包含推文、用户立场等数据及相关文档。 文件详解 数据文件(JSON格式): hashtags_classification.json:标签分类数据,可能包含话题标签的分类结果...
-
Twitter气候变化标签与关键词数据集
数据集概述 该数据集收集了Twitter平台上与气候变化相关的标签和关键词,分为支持与意识类、批判与怀疑类、两党气候类三大类别,覆盖带标签和无标签关键词,经清洗后确保数据准确性,为社交媒体话语分析提供结构化数据支持。 文件详解 文件名称:Climate Change Hashtags and Keywords on Twitter.pdf...
-
Twitter平台攻击与欺凌行为检测数据集
数据集概述 该数据集围绕Twitter平台的攻击与欺凌行为检测展开,包含160万条推文数据,覆盖3个月时间范围。数据支持提取文本、用户及网络属性,用于研究欺凌者与攻击者的特征差异,为相关机器学习分类模型提供训练与评估基础。 文件详解 文件名称: websci_dataset.zip 文件格式: ZIP压缩包 内容说明:...
-
大学网络影响力的Twitter超链接网络计量指标补充材料
数据集概述 本数据集为补充材料,聚焦Twitter嵌入超链接作为网络计量指标的应用,分析其衡量大学网络影响力的可行性。通过Topsy工具采集200所大学相关含链接推文,对比MajesticSEO、OpenSiteExplorer等来源数据,开展统计检验与预测模型分析,为网络计量研究提供实证数据支持。 文件详解...
-
科学社会互联价值创造模型组件与原型数据集
数据集概述 本数据集是研究《科学社会互联的价值创造模型:组件与原型》的配套资料,包含论文支撑信息、研究主题标题文本及原型分析结构化数据,为探索科学领域与社会互联的价值创造模式提供数据支持。 文件详解 文件名称: supplement_information.pdf 文件格式: PDF 内容说明:...
-
Twitter_API_Based_Twitter_Political_Polarization_2010_选举前推文网络完整数据
数据集概述 该数据集是用于生成2011年ICWSM会议论文《Political Polarization on Twitter》结果的训练数据,包含2010年国会中期选举前六周内,通过Twitter流API采样的公共推文构建的三个Twitter用户间政治传播网络。 文件详解 文件名称: LICENSE.CC-BY-NC-ND-4.0.txt 文件格式:...
-
莱里达省图书馆社交媒体数据集2020
数据集概述 本数据集记录了2020年2月收集的西班牙莱里达省各图书馆的社交媒体账号信息,包含多个行政区的图书馆在Twitter、Facebook等主流社交平台的账号数据,为研究图书馆数字化服务渠道分布提供基础资料。 文件详解...
-
Twitter与Facebook数据挖掘及情感分析数据集
数据集概述 本数据集围绕Twitter与Facebook平台的数据挖掘及情感分析主题构建,包含从Google Scholar获取的相关学术文献元数据,涵盖文献标题、作者、发表年份、被引次数等核心信息,为该领域研究提供文献基础数据。 文件详解 数据集核心文件:...
-
气候安全相关推文ID数据集2014_2022
数据集概述 本数据集包含2014年1月至2022年3月期间,Twitter平台上反映气候安全对话的推文ID。数据集由3个文件组成,涵盖推文ID列表、查询说明及文档,为研究气候安全议题在社交媒体上的传播提供数据支持。 文件详解 文件名称: cs_tweets_ids.txt 文件格式: TXT 字段映射:...
-
股票标签搭载数据集_2017
数据集概述 本数据集包含2017年5月至9月期间约九百万条提及美国主要市场股票标签的Twitter推文数据(含用户机器人分类标签),以及约三万家相关公司的金融信息,为研究股票微博中的垃圾信息与机器人活动提供支持。 文件详解 READ.ME: .me格式,可能包含数据集说明文档 entities.csv.zip: CSV压缩文件,可能包含实体相关数据...
-
Webis标题党破解语料库2022
数据集概述 该数据集包含从Facebook、Reddit和Twitter爬取的五千条标题党帖子及其对应的破解内容,按训练、验证、测试集划分。破解内容分为短语型、段落型和非连续多文本型三类,曾用于SemEval-2023标题党破解任务。 文件详解 文件名称: webis-clickbait-22.zip 文件格式: ZIP压缩包 内部文件(按预设划分):...



