韩语仇恨言论数据集

韩语仇恨言论数据集 数据来源:互联网公开数据
标签:韩语,仇恨言论,文本分类,自然语言处理,社会分析,多分类模型,二分类模型

数据概述:
本数据集包含韩语仇恨言论文本数据,由从韩国右翼网站“일간베스트”爬取的仇恨和歧视性评论组成。数据集分为两部分:
1. hate-speech-binary-dataset.csv:包含仇恨言论与正常言论的二分类数据,字段包括“문장”(句子)和“혐오 여부”(仇恨与否,0表示仇恨言论,1表示正常言论)。
2. hate-speech-topic-dataset.csv:包含基于主题分类的仇恨言论数据,使用NMF主题模型算法对仇恨言论进行分类,字段包括“문장”(句子)和“혐오 여부”(仇恨主题分类,0表示针对特定地区的歧视,1表示针对不同政治观点的人类化攻击,2表示种族主义言论,3表示性别相关仇恨言论)。

数据用途概述:
该数据集适用于仇恨言论检测、文本分类任务以及社会分析研究。研究者可以利用此数据集训练仇恨言论检测模型,支持韩语文本中的仇恨言论识别与分类;企业或机构可以将其用于社交媒体监管或内容审核系统;学术研究者可以基于数据集分析仇恨言论的分布特征及其背后的社会动因。此外,数据集中的分类模型(包括二分类模型和多分类模型)可用于进一步优化仇恨言论检测算法,提升模型的准确性和实用性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 48.56 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。