冒犯性语言文本数据集(英文)

数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 
count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。
hate_speech = 判断推文为仇恨言论的CF用户数量。
 offensive_language = 判断推文为冒犯性语言的CF用户数量。 
neither = 判断推文既不冒犯也不非冒犯的CF用户数量。

packageimg

数据与资源

附加信息

字段
数据集大小 2.43 MiB
最后更新 2024年11月9日
创建于 2024年11月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。