找到2个数据集

格式: ZIP 标签: 粗俗语言

过滤结果
  • nlp2023_toxic_german_德语新闻评论毒性标注数据集

    2026年1月27日 30 87 58

    数据集概述 本数据集包含2021年11月4日至10日期间奥地利报纸DerStandard网站的新闻评论数据,共4473条原创评论(排除评论回复),涉及522篇文章。数据包含2818条无毒评论和1655条有毒评论,类别分布相对均衡。每条评论标注了二进制毒性标签,部分评论还包含粗俗语言、目标个体、目标群体、其他目标四类细分标签及文本位置信息。 文件详解...
    packageimg
  • 电影内容分级数据集

    2025年4月14日 30 54 7

    电影内容分级数据集 数据来源:互联网公开数据 标签:电影分级,内容分析,暴力,色情,粗俗语言,电影元数据,内容过滤 数据概述: 本数据集收集了关于电影中暴力、色情和粗俗内容的详细信息,旨在帮助用户了解不同电影的内容分级和潜在争议性内容。数据集包含以下三个文件: 1. movie_tags.csv:记录每部电影中暴力、色情和粗俗内容的具体程度。 2....
    packageimg