-
CompactIE_Based开放信息抽取紧凑事实数据集
2026年1月30日 30 38 10
数据集概述 本数据集为论文“CompactIE: Compact Facts in Open Information Extraction”配套数据,包含开放信息抽取任务中紧凑事实提取相关内容,仅含一个JSON格式文件,无训练测试、数据标签或原始处理数据拆分。 文件详解 文件名称:benchmark.json 文件格式:JSON...
-
EuPMC_Based_开放获取出版物命名实体提取事实数据
2026年1月29日 30 140 46
数据集概述 本数据集从2016年6月1日至5日的EuropePMC开放获取(OA)出版物全文中提取命名实体,通过将文本加载到ElasticSearch并使用ContentMine词典查询完成。包含2个JSON格式文件,无目录层级,未划分训练/测试、数据/标签或原始/处理集,文件类型单一为JSON。 文件详解...
-
Text2KGBench本体驱动文本生成知识图谱基准数据集
2025年12月13日 30 69 40
数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...



