-
Nerwip_Corpus_Named_Entity_Recognition_传记文本实体标注语料库
2026年1月5日 30 206 138
数据集概述 本数据集为Nerwip语料库,包含408篇维基百科传记文章,人工标注了日期、地点、组织、人物四类实体,用于评估和比较NER工具在传记文本上的性能。还包含NER工具所需的模型、词典等文件,需按说明解压使用。 文件详解 文件名称:nerwip-4-data.zip 文件格式:ZIP 字段映射介绍:包含408篇标注传记文本及相关数据...
-
ENHG_TMAMMT_Based_Schwazer_Berglehenbuch采矿文献TEI实体标注数据
2025年12月30日 30 178 80
数据集概述 本数据集包含1515年左右的历史采矿文献《Schwazer Berglehenbuch》(TLA Hs. 1587)的TEI标注数据,由因斯布鲁克大学“Text Mining Medieval Mining Texts”项目团队生成,标注实体包括人物、地点、矿山、日期,存储于奥地利蒂罗尔地区档案馆。 文件详解...



