多语言命名实体识别数据集英语

多语言命名实体识别数据集英语 数据来源:互联网公开数据 标签:多语言,命名实体识别,PER,LOC,ORG,MISC,自然语言处理 数据概述: 本数据集为多语言命名实体识别任务提供了一个经过处理的数据集版本,主要来源于GitHub项目(https://github.com/afshinrahimi/mmner),并在Amazon Cloud Drive上提供了218种语言的数据下载链接(https://www.amazon.com/clouddrive/share/d3KGCRCIYwhKJF0H3eWA26hjg2ZCRhjpEQtDL70FSBN)。该数据集目前包含了部分语言的数据,并针对这些语言标注了以下四种实体类型:PER(人名)、LOC(地名)、ORG(组织名)和MISC(其他实体)。 数据用途概述: 该数据集适用于多种自然语言处理任务,尤其是多语言命名实体识别的研究和应用。研究人员可以利用此数据集来训练和评估命名实体识别模型,以提高其在不同语言上的识别准确性。此外,该数据集也适合用于比较分析不同语言之间命名实体识别的特点和差异,以及开发跨语言的信息提取系统。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.0 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。