找到2个数据集

标签: 句子文本

过滤结果
  • NewsNinja_Based_媒体偏见众包标注数据集_2023

    2026年1月28日 30 70 44

    数据集概述 本数据集是通过News Ninja游戏收集的众包标注数据,用于提升语言媒体偏见的自动检测能力。数据包含玩家标注的句子偏见标签、专家对比标注及玩家人口统计信息,所有数据匿名化处理,可支持媒体偏见检测模型训练与标注一致性分析。 文件详解 ExportNewsNinja.csv 文件格式:CSV...
    packageimg
  • CrowdTruth_Based_众包命名实体黄金标准数据_v1_0

    2026年1月23日 30 205 50

    数据集概述 本数据集包含通过混合多命名实体识别(Multi-NER)众包增强方法,在英文维基百科句子中识别和分类命名实体的实验结果,提供众包标注的命名实体黄金标准数据,支持自然语言处理领域的相关研究与应用。 文件详解 文件名称:CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard-v1.0.zip...
    packageimg