-
表格数据实体链接基准数据集
2025年12月20日 30 12 8
数据集概述 本数据集是用于评估结构化表格数据实体链接算法的基准套件,包含五个子数据集(HTR1、HTR2、Movies、Companies、SN),覆盖学术挑战、维基数据构建及真实采购场景,为算法性能验证提供标准化数据支持。 文件详解...
-
维基数量与维基测量数据集
2025年12月11日 30 115 114
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
疾病本体术语与维基数据多语言映射数据集2020
2025年12月9日 30 199 176
数据集概述 本数据集包含2020年2月13日通过维基数据查询服务获取的1000个疾病本体术语及其维基数据映射,覆盖英语及印地语、孟加拉语等十七种主要印度语言,旨在评估非英语语言疾病相关术语的覆盖进展。 文件详解 SPARQL.txt:文本格式,存储用于获取数据的SPARQL查询语句,包含疾病本体ID筛选、多语言标签获取等查询逻辑。...
-
陶器术语内在因素数据集
2025年12月9日 30 152 119
数据集概述 该数据集是考古学领域中用于描述陶器内在因素的德英双语术语集合,依据Rice 2015提出的内在与外在因素划分框架构建,部分术语与维基数据进行了整合,还补充了希腊器形术语以确保完整性。 文件详解 数据文件:...
-
犹太企业_Gorbatschow_Liköre_F_Kramer_Co_的维基数据对象数据集
2025年12月8日 30 56 0
数据集概述 本数据集为犹太企业"Gorbatschow Liköre F. Kramer & Co"的维基数据对象示例,记录了该企业的核心属性信息,包括所有权、时间节点及来源等,基于维基数据条目构建,是历史研究中开放数据管理的实践案例。 文件详解 ReadMe.md:Markdown格式文档,由Sophie...



