-
EuPMC_Based_开放获取出版物命名实体提取事实数据
2026年1月29日 30 156 1
数据集概述 本数据集从2016年6月1日至5日的EuropePMC开放获取(OA)出版物全文中提取命名实体,通过将文本加载到ElasticSearch并使用ContentMine词典查询完成。包含2个JSON格式文件,无目录层级,未划分训练/测试、数据/标签或原始/处理集,文件类型单一为JSON。 文件详解...
-
内容挖掘_剑桥大学_欧洲公共医学中心_寨卡病毒论文元数据与事实提取数据_20160831
2026年1月13日 30 142 30
数据集概述 本数据集通过ContentMine Cambridge流程从EuropePMC平台查询“zika”关键词返回的论文中提取事实和元数据,包含2个JSON文件,数据截止时间为2016年8月31日,可用于 Zika 相关医学文献的结构化分析。 文件详解 文件名称:zikametadata-2016-08-31.json 文件格式:JSON...
-
ContentMine_Based_EuropePMC_Zika开放获取论文分析数据_20160919
2026年1月2日 30 69 39
数据集概述 本数据集包含通过ContentMine Cambridge流程从EuropePMC查询“zika”返回的524篇开放获取论文中提取的元数据与事实数据。数据使用的词典包含维基数据ID,可用于Zika相关医学文献的结构化分析,共包含2个JSON文件。 文件详解 文件名称:open-zika-wiki-...



