-
SEA_Insect_Conservation_Based_东南亚昆虫保护知识与能力缺口研究数据
2026年1月9日 0 174 35
数据集概述 本数据集为论文“Identifying the knowledge and capacity gaps in Southeast Asian insect...
-
Ecosia_Related_Tweets_Social_Media_Data_2024_2025
2026年1月6日 30 169 157
数据集概述 本数据集包含2024年1月1日至2025年7月21日期间与Ecosia相关的推文数据,共三份文件。数据覆盖原始、清洗及标注三种形态,包含推文内容、互动数据、用户信息等核心字段,部分文件添加了情感标签,可用于分析Ecosia相关话题的社交媒体传播特征。 文件详解 ecosia_2024.xlsx 文件格式:XLSX...
-
BalotajeArgentina2015_SentimientoTweets_社交媒体情感分析数据
2026年1月4日 30 27 10
数据集概述 本数据集基于阿根廷2015年总统决选期间的Twitter推文情感分析,通过自然语言处理技术提取用户对总统候选人的态度倾向,可用于预测选民投票意向。数据由Kunan公司提供,包含3个压缩文件,覆盖推文内容、情感分析结果及用户定位信息。 文件详解 情感分析结果文件: 文件名称:sentimientos.txt.zip 文件格式:TXT(压缩包)...
-
Dia_Pol_Based_BlackLivesMatter和MeToo英文推文数据集_2020_2021
2025年12月31日 30 119 1
数据集概述 本数据集包含2020年1月1日至2021年12月31日期间,通过Twitter API以“#blacklivesmatter”为查询词提取的258609条英文推文数据,以及对应的采集脚本,整体用于社交媒体话题研究。 文件详解 推文ID列表文件: 文件名称:tweets_id_list.json 文件格式:JSON...
-
Cross_Domain_Propaganda_Detection_印度社交媒体CAA抗议活动宣传检测数据集
2025年12月29日 30 30 2
数据集概述 本数据集聚焦印度2019年CAA抗议活动相关的社交媒体内容,包含464篇新闻文章(按句子分类为宣传或非宣传)和597条手动标注18种宣传技术的推文,用于跨域宣传检测任务,为相关研究提供结构化标注数据。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
-
数据2021年墨西哥立法选举推文选举模型设计与分析数据集
2025年12月21日 30 56 2
数据集概述 本数据集为Vigna-Gómez等人关于“2021年墨西哥立法选举推文选举模型设计与分析”手稿分析所用的处理数据,包含2020年12月至2021年5月的月度推文数据集及相关查询文档,支持选举模型研究。 文件详解 月度推文数据压缩包(共6个):...
-
意大利Twitter回声室起源数据集2020欧洲杯
2025年12月20日 30 95 5
数据集概述 该数据集聚焦2020欧洲杯期间意大利Twitter平台上BLM/种族主义话题的讨论,通过多拓扑层面分析回声室的起源与演变,关联其形成与特定事件的关系,包含推文、用户立场等数据及相关文档。 文件详解 数据文件(JSON格式): hashtags_classification.json:标签分类数据,可能包含话题标签的分类结果...
-
英国脱欧主题推文数据集2016
2025年12月20日 30 60 32
数据集概述 本数据集包含2016年5月至8月期间收集的带#brexit标签的推文数据,涵盖推文数量时间分布、推文ID等信息,通过多种文件形式呈现,为研究英国脱欧相关社交媒体讨论提供支持。 文件详解 说明文档: readme.html: HTML格式的说明文档,介绍数据集基本信息 readme.rst: RST格式的说明文档,提供数据集内容及文件说明...
-
Twitter平台攻击与欺凌行为检测数据集
2025年12月19日 30 185 139
数据集概述 该数据集围绕Twitter平台的攻击与欺凌行为检测展开,包含160万条推文数据,覆盖3个月时间范围。数据支持提取文本、用户及网络属性,用于研究欺凌者与攻击者的特征差异,为相关机器学习分类模型提供训练与评估基础。 文件详解 文件名称: websci_dataset.zip 文件格式: ZIP压缩包 内容说明:...
-
佐科威学位问题社交媒体集群分析数据集
2025年12月19日 30 204 78
数据集概述 本数据集包含2025年4月27日至29日期间,印尼社交媒体平台X上关于佐科威学位问题的1014条匿名推文。数据涵盖原始文本、预处理结果及K-Means聚类生成的主题标签,为研究印尼社会政治议题的公众舆论动态提供支持。 文件详解 文件名称: tiamufh/DatasetIsuIjazahJokowi-v1.1.zip 文件格式:...
-
数据2020年灾难推文语料库
2025年12月7日 30 89 45
数据集概述 该数据集包含2020年收集的、覆盖10类灾难共48起事件的推文数据,每条推文标注了是否与对应灾难相关。数据以平衡正负样本的文件形式组织,旨在为灾难相关推文过滤算法提供基准测试支持。 文件详解 文件名称:disaster-tweet-filtering-tranquil-tweets.zip 文件格式:ZIP压缩包...
-
股票标签搭载数据集_2017
2025年12月10日 30 83 18
数据集概述 本数据集包含2017年5月至9月期间约九百万条提及美国主要市场股票标签的Twitter推文数据(含用户机器人分类标签),以及约三万家相关公司的金融信息,为研究股票微博中的垃圾信息与机器人活动提供支持。 文件详解 READ.ME: .me格式,可能包含数据集说明文档 entities.csv.zip: CSV压缩文件,可能包含实体相关数据...
-
Twitter仇恨言论检测与分析数据集
2025年12月8日 30 62 25
数据集概述 该数据集包含用于Twitter仇恨言论检测与分析研究的两个语料库:2017年2月至12月收集的200万条原始推文,以及6000条标注是否包含仇恨内容的推文,为相关研究提供数据支持。 文件详解 文件名称:labeled_corpus_6K.txt 文件格式:TXT(.txt)...
-
西班牙语COVID_19推文职业检测黄金标准标注数据集2021
2025年12月6日 30 86 64
数据集概述 本数据集包含一万条带黄金标准标注的西班牙语COVID-19推文,按训练集、验证集、测试集以六十比二十比二十比例划分,涵盖职业分类与命名实体识别两个子任务的标注数据,同时提供多格式文件及工具脚本,支持自然语言处理模型训练与评估。 文件详解 数据集为压缩包格式,包含两个子任务相关文件,具体说明如下: - subtask-1(职业分类子任务):...
-
精英Twitter极化数据集2010_2021
2025年12月5日 30 146 82
数据集概述 本数据集包含2010年1月1日至2021年12月31日期间9位全球知名公众人物的Twitter活动标注数据,涵盖原创推文和转推,包含情感评分、极化分类及主题分配等信息,覆盖政治、商业、体育等多元领域。 文件详解 该数据集以压缩包形式存储,按人物划分目录,每个目录包含两个Excel文件,具体说明如下: - 压缩包文件:Elite...
-
印度尼西亚大选候选人推文情感分析数据集
2025年10月31日 30 51 19
印度尼西亚大选候选人推文情感分析数据集_Indonesia_Election_Candidate_Tweet_Sentiment_Analysis 数据来源:互联网公开数据 标签:社交媒体, 情感分析, 文本挖掘, 推文数据, 选举, 政治, 自然语言处理, 印度尼西亚 数据概述:...
-
社交媒体饮食失调相关推文数据集
2025年10月9日 30 65 42
社交媒体饮食失调相关推文数据集_Social_Media_Eating_Disorder_Related_Tweets 数据来源:互联网公开数据 标签:社交媒体, 推文数据, 饮食失调, 文本分析, 自然语言处理, 情感分析, 异常检测, 健康医疗 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了与饮食失调相关的内容。主要特征如下:...
-
社交媒体Twitter用户推文情感分析数据集
2025年8月12日 30 23 17
社交媒体Twitter用户推文情感分析数据集_Social_Media_Twitter_User_Tweet_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 推文数据, 自然语言处理, 文本分析, 情绪识别, 数据挖掘, 用户行为 数据概述:...
-
K-Means聚类推文数据集-ved1104
2025年5月30日 30 115 108
K-Means聚类推文数据集-ved1104 数据来源:互联网公开数据 标签:推文数据,文本聚类,机器学习,自然语言处理,社交媒体,数据挖掘,情感分析,主题建模 数据概述: 该数据集包含了从Twitter上收集的推文数据,这些数据经过了K-Means聚类分析。主要特征如下: 时间跨度:数据记录的时间范围不详,取决于原始推文的收集时间。...
-
法律领域推文数据集Tweets-LawDataset-milanezeus
2025年5月30日 30 186 183
法律领域推文数据集Tweets-LawDataset-milanezeus 数据来源:互联网公开数据 标签:推文数据,法律,社交媒体,文本分析,自然语言处理,情感分析,舆情监测,法律研究 数据概述: 该数据集包含来自Twitter平台的推文数据,主要与法律领域相关。主要特征如下:...



