社交平台可疑言论检测数据集-Twitter与Facebook-2024-syedabbasraza

社交平台可疑言论检测数据集-Twitter与Facebook-2024-syedabbasraza 数据来源:互联网公开数据 标签:社交媒体,言论分析,仇恨言论,网络欺凌,文本挖掘,情感分析,Twitter,Facebook,恶意内容检测 数据概述: 本数据集旨在研究社交平台上的仇恨言论和滥用行为。数据来源于Twitter和Facebook群组,主要关注涉及种族主义、歧视、辱骂性语言、威胁等可疑活动,这些行为通常与网络欺凌相关。

数据通过对推文和评论中出现的“可疑词汇”进行人工标注,标记为“1”(表示可疑)或“0”(表示非可疑)。数据集包含约2万条情感分析数据。其中,约1.2万条数据被标记为负面情感,例如包含种族主义、歧视或辱骂性内容;其余8千条数据被标记为正面或中性情感,表示不含可疑内容。

数据用途概述: 该数据集可用于开发和训练检测社交网络上可疑言论的系统。研究人员可以利用此数据进行情感分析,识别社交媒体上的恶意内容,例如仇恨言论、歧视言论和网络欺凌行为。此外,该数据集还可用于训练机器学习模型,以自动检测和标记社交媒体上的可疑言论,从而帮助平台维护健康的网络环境,并支持相关社会学研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.59 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。