数据集

冒犯性语言文本数据集（英文）

数据以CSV格式和pickled pandas数据框（Python 2.7）存储。  count = 编码每条推文的CrowdFlower用户数量（最小值为3，有时当CF判断推文不可靠时，会有更多用户编码一条推文）。 hate_speech = 判断推文为仇恨言论的CF用户数量。  offensive_language = 判断推文为冒犯性语言的CF用户数量。  neither = 判断推文既不冒犯也不非冒犯的CF用户数量。

数据与资源

labeled_data.csvtext/csv
2.43 MiB

下载

附加信息

字段	值
数据集大小	2.43 MiB
最后更新	2024年11月9日
创建于	2024年11月9日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

冒犯性语言文本数据集（英文）

数据与资源

附加信息

注册成功！