找到7个数据集

标签: 标注指南

过滤结果
  • 业务流程信息抽取辅助数据标注数据集

    2025年12月10日 30 160 58

    数据集概述 该数据集围绕文本文件中业务流程信息抽取的辅助数据标注展开,包含标注指南、问卷、工作负荷数据及实验结果等文件,为研究辅助标注对业务流程信息抽取任务的影响提供多维度数据支持。 文件详解 该数据集包含3个文档文件和3个数据文件,具体说明如下: - 文档文件: - Annotation-EN.pdf:...
    packageimg
  • 现代藏文报纸命名实体识别数据集_标注集与指南

    2025年12月9日 30 187 141

    数据集概述 本数据集包含现代藏文报纸命名实体识别(NER)的标注集、指南及训练数据,聚焦中国境内当代藏文媒体文本。涵盖17类实体标签、经人工审核的训练数据及原始标注文件,为藏文NER模型开发提供基础资源。 文件详解 标注规范文件: NER for Modern Tibetan-tagset and...
    packageimg
  • 西班牙手语书写VisSE语料库

    2025年12月7日 30 86 46

    数据集概述 该数据集是西班牙手语书写(SignWriting)的语料库,包含经图形与语义标注的手写样本,覆盖西班牙手语的词汇与视觉含义。还提供用于自动识别的训练神经网络,支持Quevedo及第三方工具,采用标准开放格式。 文件详解...
    packageimg
  • 格拉茨合成临床文本受保护健康信息标注数据集

    2025年12月7日 30 149 5

    数据集概述 该数据集包含人工生成的德语半结构化与非结构化临床摘要,附有用INCEpTION平台标注的受保护健康信息(PHI),含标注文件、类型系统及指南文档,为临床文本去标识研究提供支持。 文件详解 标注文件: grascco_phi_annotation_json.zip: ZIP格式,包含JSON格式的PHI标注数据...
    packageimg
  • 多语言错误信息推文数据集

    2025年12月7日 30 194 132

    数据集概述 该数据集包含多语言错误信息推文(MMTweet)相关的标注指南、结构化数据文件、代码脚本等资源,覆盖推文分类、声明匹配等任务,支持多语言错误信息检测与分析研究。 文件详解 标注指南文件: Data Annotation – Tweet Classification.pdf:PDF格式,推文分类任务的标注规范文档 Data...
    packageimg
  • RANLP2023_Covid19_Misinformation_Based_错误信息分类完整数据集

    2025年12月5日 30 165 13

    数据集概述 该数据集包含COVID-19相关错误信息的标注数据及指南,源自RANLP 2023收录的研究,围绕细粒度到粗粒度错误信息分类展开,为研究COVID-19信息疫情中的错误信息特征提供支持。 文件详解 JSON数据文件: 文件名称:COVID-19-dataset-zenodo.json 文件格式:JSON...
    packageimg
  • 佛教梵语嵌入模型评估数据集

    2025年12月4日 30 168 71

    数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...
    packageimg