社交媒体网络欺凌文本情感分析数据集SocialMediaCyberbullyingTextSentimentAnalysis-yohandeny
数据来源:互联网公开数据
标签:网络欺凌, 情感分析, 文本分类, 社交媒体, 欺凌检测, 数据标注, 自然语言处理, 负面情绪
数据概述:
该数据集包含来自社交媒体平台的文本数据,记录了用户发布的涉及网络欺凌行为的言论,并标注了情感极性。主要特征如下:
时间跨度:数据未标明具体时间,视作静态文本语料数据集使用。
地理范围:数据来源不明确,但内容反映了普遍存在的网络欺凌现象。
数据维度:包括“teks”(文本内容)、“label”(欺凌类型,如Bully)和“polarity”(情感极性,如Bullying)三个字段,适用于文本分类和情感分析任务。
数据格式:CSV格式,文件名为cleaned_labeled_Cyberbully.csv,便于文本处理和建模分析。
来源信息:数据来源于社交媒体平台的用户生成内容,并经过人工标注,用于识别和分析网络欺凌行为。该数据集适合用于研究社交媒体上的负面言论,以及构建情感分析模型。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于自然语言处理、社会学、心理学等领域的研究,如网络欺凌检测、负面情绪分析、情感极性预测等。
行业应用:为社交媒体平台、在线社区等提供数据支持,尤其适用于内容审核、用户行为分析、风险预警等。
决策支持:支持平台制定内容管理政策,提升用户体验,保护用户免受网络欺凌的侵害。
教育和培训:作为情感分析、文本分类、网络安全等课程的实训数据,帮助学生和研究人员深入理解网络欺凌的识别与应对。
此数据集特别适合用于探索网络欺凌言论的模式与特征,帮助用户开发更有效的欺凌检测算法,并提升社交媒体平台的安全性和用户体验。