-
基于卡巴耶扎尔托什语的三语铭文_词级对齐与命名实体开放数据
2026年2月9日 30 142 74
数据集概述 本数据集包含Ka'ba-ye Zartošt(ŠKZ)三语铭文的希腊语、中古波斯语、帕提亚语版本的句级与词级对齐语料,以及人工提取的命名实体。语料遵循Huyse(1999)的行编号,对齐由Ugarit工具生成,命名实体含近400个标注为人物、地点或地点衍生物的条目,部分关联维基数据。 文件详解 对齐语料文件 合并文件:alignment-...
-
Wikidata_Dump_Based维基数据RDF转储数据
2026年1月29日 30 180 23
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,包含实体、陈述和三元组信息的结构化记录,共包含4个文件,涵盖JSON、NT、GZ等格式,可用于语义网相关的数据分析与应用。 文件详解 info.json 文件格式:JSON...
-
兄弟会通讯_基于1765年起的公共新闻历史通信索引数据_2025版
2026年1月27日 30 203 161
数据集概述 本数据集为赫仁护特联合档案馆(Unitätsarchiv Herrnhut)提供的《Gemein-...
-
Wikidata_Based_2025年教皇选举红衣主教选举人查询与验证数据
2026年1月20日 30 46 24
数据集概述 本数据集为博客文章的补充材料,围绕“2025年教皇选举的红衣主教选举人是谁?这是维基数据的典型问题吗?”展开,包含维基数据查询结果、德语维基百科人工整理表格及OpenRefine处理项目,共4个文件,用于红衣主教选举人信息的查询、验证与交叉核对。 文件详解...
-
PoetryAfrica_Based诗歌非洲节1997_2022诗人传记数据集
2026年1月20日 30 138 124
数据集概述 本数据集包含1997至2022年期间参加诗歌非洲节(Poetry Africa Festival)表演诗人的传记数据,基于夸祖鲁-纳塔尔大学创意艺术中心的汇编成果,经维基数据(Wikidata)和VIAF记录补充完善,涵盖诗人基本信息、职业背景、国籍语言等维度,共含2个数据文件。 文件详解...
-
wikidata_actors_Based_维基数据演员及其电影RDF转储数据
2026年1月20日 30 33 18
数据集概述 本数据集是通过wdumps工具生成的维基数据(Wikidata)RDF转储,核心内容为维基数据中的演员及其参演电影的关联信息。数据集包含4个文件,涵盖数据规范、元信息、RDF数据压缩包及预览文件,为相关领域研究提供结构化参考。 文件详解 info.json 文件格式:JSON...
-
Dura_Europos_Based杜拉_欧罗普斯阿塔伽蒂斯神庙6号房间铭文数据
2026年1月19日 30 136 111
数据集概述 本数据集收录了杜拉-欧罗普斯遗址阿塔伽蒂斯神庙6号阶梯房间(salle-à-gradins)的全部铭文资料,所有铭文已在维基数据平台发布,是研究该古代神庙区域文字遗存的结构化数据集合。 文件详解 文件名称:Inscriptions from stepped room-Temple of Atargatis-3.xlsx 文件格式:.xlsx...
-
Deepex_Supplementary_Zero_Shot信息抽取文本转三元组补充数据集
2026年1月17日 30 79 6
数据集概述 本数据集是Zero-Shot信息抽取任务(统一为文本转三元组翻译任务)的补充数据,支持Deepex模型相关研究。包含3个文件,覆盖JSON和CSV格式,无训练/测试、数据/标签等划分,核心内容为信息抽取所需的文本与三元组映射数据。 文件详解 文件名称:wk_q2name.json 文件格式:JSON...
-
表格数据实体链接基准数据集
2025年12月20日 30 3 0
数据集概述 本数据集是用于评估结构化表格数据实体链接算法的基准套件,包含五个子数据集(HTR1、HTR2、Movies、Companies、SN),覆盖学术挑战、维基数据构建及真实采购场景,为算法性能验证提供标准化数据支持。 文件详解...
-
维基数量与维基测量数据集
2025年12月11日 30 176 91
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
疾病本体术语与维基数据多语言映射数据集2020
2025年12月9日 30 202 156
数据集概述 本数据集包含2020年2月13日通过维基数据查询服务获取的1000个疾病本体术语及其维基数据映射,覆盖英语及印地语、孟加拉语等十七种主要印度语言,旨在评估非英语语言疾病相关术语的覆盖进展。 文件详解 SPARQL.txt:文本格式,存储用于获取数据的SPARQL查询语句,包含疾病本体ID筛选、多语言标签获取等查询逻辑。...
-
陶器术语内在因素数据集
2025年12月9日 30 135 98
数据集概述 该数据集是考古学领域中用于描述陶器内在因素的德英双语术语集合,依据Rice 2015提出的内在与外在因素划分框架构建,部分术语与维基数据进行了整合,还补充了希腊器形术语以确保完整性。 文件详解 数据文件:...
-
犹太企业_Gorbatschow_Liköre_F_Kramer_Co_的维基数据对象数据集
2025年12月8日 30 166 70
数据集概述 本数据集为犹太企业"Gorbatschow Liköre F. Kramer & Co"的维基数据对象示例,记录了该企业的核心属性信息,包括所有权、时间节点及来源等,基于维基数据条目构建,是历史研究中开放数据管理的实践案例。 文件详解 ReadMe.md:Markdown格式文档,由Sophie...
-
软件项目版权信息分析数据集SoftwareProjectCopyrightInformation-azevedolima
2025年5月1日 30 93 42
软件项目版权信息分析数据集SoftwareProjectCopyrightInformation-azevedolima 数据来源:互联网公开数据 标签:软件项目, 版权信息, 知识产权, 数据挖掘, 语义分析, 文本处理, 信息检索, 维基数据 数据概述:...
-
知识图谱实体识别与问答数据集KnowledgeGraphEntityRecognitionandQuestionAnsweringDataset-jame...
2025年5月1日 30 134 46
知识图谱实体识别与问答数据集KnowledgeGraphEntityRecognitionandQuestionAnsweringDataset-jamesleyjoseph 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 问答系统, 自然语言处理, 数据标注, 关系抽取, 机器学习, 文本分析 数据概述:...
-
问答知识图谱数据集QuestionAnsweringKnowledgeGraphDataset-sankalp1999
2025年5月1日 30 64 5
问答知识图谱数据集QuestionAnsweringKnowledgeGraphDataset-sankalp1999 数据来源:互联网公开数据 标签:知识图谱, 问答系统, 自然语言处理, 实体识别, 关系抽取, 文本匹配, 数据集构建, 机器学习 数据概述: 该数据集包含来自维基数据 (Wikidata)...
-
加那利群岛文化遗产知识库数据集-ivanhercaz
2025年4月22日 30 125 55
加那利群岛文化遗产知识库数据集-ivanhercaz 数据来源:互联网公开数据 标签:文化遗产,加那利群岛,维基数据,维基媒体,知识库,开放数据,文化研究,西班牙语 数据概述: 本数据集包含关于加那利群岛文化遗产在维基媒体项目中的知识数据,具体包括来自维基数据(Wikidata)、维基百科西班牙语版(eswiki)和维基共享资源(Wikimedia...
-
维基数据全球企业信息概览数据集-gautiermarti
2025年4月22日 30 104 21
维基数据全球企业信息概览数据集-gautiermarti 数据来源:互联网公开数据 标签:全球企业,维基数据,公司信息,企业名录,行业分析,公司概况,企业数据库 数据概述:...
-
维基数据员工标签化数据集-2020年2月-toddcook
2025年4月22日 30 186 74
维基数据员工标签化数据集-2020年2月-toddcook 数据来源:互联网公开数据 标签:维基数据,员工标签,职业分析,数据清理,机器学习,文本处理,自然语言处理,开源数据 数据概述:...
-
全球洞穴分布与特征数据集-vislupus
2025年4月21日 30 171 135
全球洞穴分布与特征数据集-vislupus 数据来源:互联网公开数据 标签:洞穴,地理,地质,自然,维基百科,维基数据,全球分布,洞穴特征 数据概述: 本数据集收录了来自世界各地的洞穴数据,包含了洞穴的地理位置、地质特征、相关描述等信息。数据来源于维基百科和维基数据,覆盖了不同国家和地区的洞穴。 数据用途概述:...



