找到2个数据集

标签: NLP模型开发

过滤结果
  • Common_Voice_11_0_Spoken_NER_Dataset

    2026年1月22日 30 50 9

    数据集概述 本数据集是基于Common Voice 11.0构建的口语命名实体识别(Spoken NER)数据集,包含荷兰语、英语和德语三种语言的口语命名实体识别数据,共3个JSON格式文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 荷兰语口语命名实体识别数据文件 文件名称:cv_nl_dataset.json...
    packageimg
  • BIOMAT_AnatNER生物材料解剖结构命名实体识别训练与验证集

    2025年12月7日 30 133 112

    数据集概述 该数据集是BIOMATDB项目下的BIOMAT-AnatNER语料库训练(750篇文档)与验证(100篇文档)集,聚焦生物材料相关文献中解剖结构(组织、器官、身体部位)的命名实体识别标注,支持相关NER模型开发。 文件详解 文件名称:BIOMAT-AnatNER_Train_Set.zip 文件格式:ZIP压缩包(.zip)...
    packageimg