-
AffRoDB_Based_机构字符串到ROR标识符映射数据集2024
2026年1月26日 30 85 26
数据集概述 本数据集是AffRoDB,包含从Crossref提取的原始机构隶属关系字符串与Research Organization Registry(ROR)标识符的人工整理映射。每条记录经专家评估,包含出版物DOI、原始机构字符串、专家判断及最终ROR ID,基于2024年1月ROR数据库版本构建,用于机构隶属关系消歧方法的评估与基准测试。...
-
LiterallyWikidata_Based_知识图谱补全基准数据集
2026年1月23日 30 46 10
数据集概述 本数据集是从Wikidata和Wikipedia中提取的知识图谱补全基准数据集,重点关注字面量信息,仅包含一个压缩文件,无目录层级结构,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 文件名称:LiterallyWikidata.zip 文件格式:ZIP(压缩包)...
-
Topic_Modeling_Based_社会与新闻媒体主题建模基准数据集
2026年1月21日 30 151 37
数据集概述 本数据集为主题建模任务提供基准数据,包含20个新闻组数据集及Reddit健康论坛r/Cancer的帖子集合,用于比较基于粒子群优化(PSO)的聚类方法与传统主题建模技术。数据集共4个文件,支持NLP领域的主题建模研究与算法评估。 文件详解 文档类文件 文件名称:readme.docx 文件格式:DOCX...
-
Robust_Table_Integration_Based数据湖表集成基准数据集
2026年1月15日 30 23 14
数据集概述 本数据集是论文《Robust Table Integration in Data Lakes: From Integrable Set Discovery to Multi-Tuple Conflict Resolution》的基准数据,包含三个压缩文件,用于支持数据湖表集成相关方法的评估,涉及可集成集发现、多元组冲突解决等任务的测试场景。...
-
SciQA基准数据集及RDF转储数据
2025年12月19日 30 49 41
数据集概述 本数据集包含SciQA基准的问题与查询数据,分为人工构建(一百条)和自动生成(两千四百六十五条)两类问题。提供JSON格式的问题/查询文件及RDF NTriples格式的转储文件,支持导入RDF引擎进行查询分析。 文件详解 该数据集包含两个压缩文件,具体说明如下: - 文件名称: SciQA-...
-
Text2KGBench本体驱动文本生成知识图谱基准数据集
2025年12月13日 30 36 32
数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...



