推特种族主义检测数据分析集-2021-furqanrustam118
数据来源:互联网公开数据
标签:种族主义,推特,情感分析,深度学习,GRU,CNN,RNN,机器学习,数据集
数据概述:
本数据集收录了大量推特数据,用于分析和检测其中包含种族主义内容的推文。随着社交媒体在社会政治领域中的主导地位日益增强,多种形式的种族主义现象在网络上不断出现。种族主义在社交媒体上的表现形式多样,既包括隐性的形式(如使用表情包),也包括公开的言论(如使用虚假身份发表仇恨言论以煽动仇恨、暴力和社会不稳定性)。虽然传统上种族主义与种族有关,但如今其基于肤色、血统、语言、文化甚至宗教而盛行。社交媒体上的种族差异言论被视为对社会、政治和文化稳定性的严重威胁,这威胁到了不同国家的和平。因此,作为种族主义言论传播的主要渠道,社交媒体应受到监控,及时检测和阻止种族主义言论。
数据集利用情感分析技术,通过构建堆叠集成深度学习模型(Gated Convolutional Recurrent-Neural Networks, GCR-NN)来检测包含种族主义内容的推文。GCR-NN模型结合了门控循环单元(GRU)、卷积神经网络(CNN)和循环神经网络(RNN),其中GRU用于从原始文本中提取合适的特征,CNN用于提取重要特征以供RNN进行准确预测。该模型在多个机器学习和深度学习模型的性能测试中表现出色,准确率达到了0.98,能够检测出97%的包含种族主义评论的推文。
数据用途概述:
该数据集适用于种族主义检测研究、社交媒体内容分析、情感分析算法优化以及相关教育和培训场景。研究人员可以利用此数据集来开发和改进种族主义检测算法;政策制定者可以参考数据结果来制定相关政策以减少社交媒体上的种族主义言论;教育机构可以使用数据集进行相关领域的教学和培训。此外,数据集还适用于评估社交媒体平台的种族主义言论监控和管理能力,帮助平台更好地维护用户社区的和谐与稳定。