-
前100网站Pr2Graph知识图谱与正式政策数据集
数据集概述 该数据集包含针对全球前一百个网站构建的Pr2Graph知识图谱(KG)及相关正式政策信息,以压缩包形式整合存储,为研究网站政策与知识图谱关联提供数据支持。 文件详解 文件名称: KG_Formal_DToU.zip 文件格式: ZIP压缩包 内容说明: 该压缩包为数据集的唯一文件,未提供内部文件结构及字段信息,需解压后查看具体内容。...
-
纽约时报新闻小数据集
数据集概述 该数据集包含从纽约时报获取的10条新闻的前几段内容,收集于2023年Bertinoro语义网博士学校期间,由Dragon Team研究组用于项目工作。数据涉及大语言模型未包含的新信息,可用于知识图谱生成相关研究。 文件详解 文件名称: isws_pw_wikipedia_dataset - Latest News from Ney York...
-
TBGA基因疾病关联生物医学关系抽取数据集
数据集概述 该数据集为TBGA,是用于基因-疾病关联(GDA)抽取的大规模半自动标注数据集,包含训练、验证、测试集文本文件及关系名称与ID映射的JSON文件,每条记录对应从句子中提取的单个GDA,以JSON对象结构存储相关信息。 文件详解 数据集压缩包: TBGA.zip,ZIP格式,包含TBGA文件夹及内部所有文件 训练集文本文件:...
-
FoodOntoMap版本2_跨食品本体的食品概念关联数据集
数据集概述 该数据集通过不同食品本体实现食品概念标准化,包含八个描述各本体独特食品概念的数据集,以及一个提供本体间映射的主文件,所有文件均提供CSV和XLSX两种格式,为食品概念的跨本体关联提供支持。 文件详解 主映射文件:提供不同食品本体间的概念映射关系,包含CSV和XLSX两种格式...
-
Proyecto_Angelus_第一套公开数据集
数据集概述 该数据集是Proyecto Angelus项目的第一套公开数据,旨在通过文档构建的知识图谱澄清墨西哥反叛乱行动中的严重人权侵犯事件,聚焦失踪人员下落问题,包含5827个实体及81158条RDF语句,支持相关研究与分析。 文件详解...
-
人机协同神经符号学术知识组织实验材料
数据集概述 该数据集包含一项评估“人机协同(HITL)工具”实用性的实验材料,工具用于辅助构建科学内容知识图谱,支持文献语料创建、科学内容提取与人工优化两个核心阶段。数据基于熟悉Open Research Knowledge Graph(ORKG)的参与者实验生成,包含实验文档与原始结果数据,为工具有效性研究提供支持。 文件详解 实验说明文件:...
-
数据5个问答系统在QALD数据集上的学习问题数据集
数据集概述 该数据集提供5个问答系统(QA Systems)在QALD10、QALD9+DB和QALD9+WK三个数据集上的学习问题数据,以JSON格式存储。数据记录了各系统的性能表现,通过正负例区分系统回答正确(F1≥0.5)和错误(F1<0.5)的问题。 文件详解 文件名称: TF_Json.zip 文件格式: ZIP压缩包 内容说明:...
-
通用绘物本体数据集
数据集概述 该数据集为通用绘物本体(GEkO)相关资源的压缩包,包含本体文件、数据集文件、验证用能力问题及模型可视化图片,支持绘物本体的研究与应用。 文件详解 文件名称: geko.zip 文件格式: ZIP压缩包 压缩包内包含资源类型: 本体文件:GEkO本体(OWL、TTL格式) 数据集文件:TTL格式的数据集...
-
知识图谱问答系统评估数据集MQALD
数据集概述 该数据集用于评估知识图谱问答(QA over KG)系统的性能,聚焦于将复杂自然语言问题转化为合规数据查询语言的能力,尤其关注含聚合函数、查询形式等修饰符的复杂问题,为该领域研究提供公开评估资源。 文件详解 文件名称: MQALD_v4.zip 文件格式: ZIP压缩包 文件内容:...
-
法国生物分类登记知识库图谱TAXREF_LD
数据集概述 该数据集是TAXREF-LD知识图谱,以关联数据形式呈现法国国家生物分类登记库TAXREF,覆盖法国本土及海外领地的动物、植物和真菌分类信息。 文件详解 文件名称: taxrefld17.zip 文件格式: ZIP压缩包 内容说明: 包含TAXREF-LD知识图谱的完整数据,具体内部文件结构需解压后查看 数据来源...
-
AMR研究中从电子表格实验室数据模板到知识图谱的FAIR数据旅程补充数据集
数据集概述 该数据集是《AMR研究中从电子表格实验室数据模板到知识图谱的FAIR数据旅程》手稿的补充数据文件,包含用于生成知识图谱的源代码及实验室数据模板所需的附加文件,支持AMR研究数据的标准化收集与FAIR化处理。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: GNA-NOW.zip - 文件格式: ZIP (.zip) -...
-
SeaLiT本体_海事历史信息建模的CIDOC_CRM扩展
数据集概述 本数据集是SeaLiT本体的相关文件集合,该本体通过扩展CIDOC-CRM(ISO 21127:2014),为海事历史信息提供语义定义,旨在整合异构海事历史信息,促进领域专家与IT开发者的协作,支持历史信息的正确处理与系统功能规范制定。 文件详解 文件名称:...
-
土壤健康知识图谱数据集
数据集概述 本数据集为开源土壤健康知识图谱(SHKG),基于欧洲环境署报告构建,整合土壤健康概念、威胁指标及阈值等信息,采用SKOS框架建模,关联外部词汇表,包含11,715个RDF三元组与2,018个实体,支持语义查询与知识共享。 文件详解 文件名称: ontology.ttl 文件格式: TTL(Turtle) 内容说明:...
-
DrugProt语料库_BioCreative_VII_Track1_药物化学物质_蛋白质相互作用文本挖掘数据集
数据集概述 该数据集是BioCreative VII Track 1任务的金标准标注语料库,包含训练集、开发集、测试集及背景集,涵盖PubMed摘要、人工标注的化学物质/基因实体及化学-蛋白质关系,用于推动药物发现、精准医疗相关的文本挖掘系统开发。 文件详解 训练集文件夹...
-
欧洲数据门户CSV数据集与DBpedia知识图谱语义链接数据集
数据集概述 该数据集包含欧洲数据门户采集的精选CSV数据集与DBpedia知识图谱的语义链接结果,围绕列类型流行度、同类型列数据集关联、高频共指实体及实体共享数据集等问题展开,为数据集关联与语义链接应用提供参考。 文件详解 EDP-CSV-Augmented-...
-
药物_靶点相互作用预测框架数据集
数据集概述 该数据集包含基于知识图谱和推荐系统的药物-靶点相互作用(DTI)预测框架相关代码与数据,涵盖多种预测方法的实现脚本、多来源DTI数据集及知识图谱数据,为DTI预测研究提供完整的实验支持。 文件详解 该数据集以压缩包形式提供,包含代码脚本和数据目录,具体说明如下: - 代码脚本: - kge_nfm.py: 实现KGE_NFM与NFM预测方法...
-
Zenodo_OAEI_2009_Based_本体对齐评估基准测试完整数据
数据集概述 该数据集包含2009年本体对齐评估计划(OAEI)使用的bench63基准测试,基于文献领域种子本体的系统性修改生成,用于评估本体匹配工具的性能与进展,提供测试本体、参考对齐及生成脚本等文件。 文件详解 核心压缩文件: bench63.zip: 压缩包格式,包含所有测试相关文件,具体内容如下: index.html: 主文档文件 编号目录:...
-
日本视觉媒体图谱_动漫角色数据库本体
数据集概述 该数据集包含用于日本视觉媒体图谱中动漫角色数据库的RDF本体文件,包括说明性PDF文档、Turtle格式的本体文件和HTML可视化文件,为动漫角色数据的结构化表示提供本体框架。 文件详解 ACDB Dataset Description.pdf:PDF格式文件,为数据集的说明文档,可能包含本体设计背景、使用方法等内容。...
-
企业实体匹配训练数据集
企业实体匹配训练数据集_Business_Entity_Matching_Training_Dataset 数据来源:互联网公开数据 标签:实体匹配, 数据融合, 相似度计算, 机器学习, 数据清洗, 关系抽取, 结构化数据, 知识图谱 数据概述: 该数据集包含多个CSV文件(train_data1.csv, train_data2.csv,...
-
教育内容推荐预测数据集
教育内容推荐预测数据集_Educational_Content_Recommendation_Prediction 数据来源:互联网公开数据 标签:推荐系统, 教育学习, 文本匹配, 自然语言处理, 知识图谱, 数据建模, 机器学习, 学习资源 数据概述:...



