-
EuPMC_Based_开放获取出版物命名实体提取事实数据
2026年1月29日 30 46 5
数据集概述 本数据集从2016年6月1日至5日的EuropePMC开放获取(OA)出版物全文中提取命名实体,通过将文本加载到ElasticSearch并使用ContentMine词典查询完成。包含2个JSON格式文件,无目录层级,未划分训练/测试、数据/标签或原始/处理集,文件类型单一为JSON。 文件详解...
-
Kleptotrace_Based_金融腐败实体抽取微型基准数据集
2026年1月27日 30 84 20
数据集概述 本数据集为微型基准数据集,包含15篇聚焦金融腐败主题的文章(共441句),以及文章中提及的个人和组织列表各1份,用于评估基于大语言模型的实体抽取流程。 文件详解 文件名称:Dataset-org.json 文件格式:JSON 字段映射介绍:包含金融腐败主题文章的文本内容,以及从中提取的个人列表和组织列表两类实体信息 数据来源...



