数据集

印尼语仇恨言论检测数据集IndonesianHateSpeechDetectionDataset-tarishamazaya

数据来源：互联网公开数据

标签：仇恨言论, 印尼语, 文本分类, 情感分析, 恶意内容检测, 社交媒体, 自然语言处理, 数据标注

数据概述：该数据集包含来自社交媒体的数据，记录了印尼语中的仇恨言论示例。主要特征如下：时间跨度：数据未明确时间范围，可视为静态文本语料。地理范围：数据主要针对印尼语环境下的社交媒体内容。数据维度：数据集包含一个关键字段“ABUSIVE”，用于标识文本是否包含仇恨言论。数据格式：CSV格式，便于文本分析与处理。来源信息：数据来源于社交媒体平台，并经过了标注处理。该数据集适合用于仇恨言论检测、情感分析和恶意内容识别研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、社会计算等领域的研究，如仇恨言论识别算法的开发、情感分析模型的训练等。行业应用：为社交媒体平台、在线社区提供数据支持，用于自动化内容审核、用户行为分析等。决策支持：支持政府机构和相关组织对网络仇恨言论的监测与治理。教育和培训：作为自然语言处理、社会计算等课程的辅助材料，帮助学生理解仇恨言论的特征和检测方法。此数据集特别适合用于构建和评估印尼语仇恨言论检测模型，助力改善网络环境。

数据与资源

versions_20250406073745.zipZIP
0.78 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.78 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。