CrowdTruth_Based_众包命名实体黄金标准数据_v1_0

数据集概述

本数据集包含通过混合多命名实体识别(Multi-NER)众包增强方法,在英文维基百科句子中识别和分类命名实体的实验结果,提供众包标注的命名实体黄金标准数据,支持自然语言处理领域的相关研究与应用。

文件详解

  • 文件名称:CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard-v1.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含众包命名实体黄金标准实验结果数据,具体字段需解压后查看,推测包含英文维基百科句子文本、命名实体标注结果、实体类型分类等信息(无预览内容,以上为基于主题的合理推断)。

数据来源

CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard仓库

适用场景

  • 命名实体识别模型训练与评估: 作为黄金标准数据,用于训练和验证自然语言处理中的命名实体识别模型性能。
  • 众包标注方法研究: 分析混合Multi-NER众包增强方法在命名实体识别任务中的有效性和可靠性。
  • 自然语言处理数据集构建: 为构建英文命名实体识别数据集提供标准化的众包标注参考。
  • 维基百科文本分析: 基于英文维基百科句子的命名实体标注结果,开展文本语义分析相关研究。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.74 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。