-
Wikidata_AI_Based_人工智能实体RDF转储数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,包含所有属于人工智能类或其子类的实体。数据以结构化格式存储,涵盖实体描述、标签、别名等元信息,为人工智能领域的知识图谱构建提供基础数据支持。 文件详解 info.json 文件格式:JSON...
-
Wikidata_Based_法官实体RDF转储数据_2024
数据集概述 本数据集是Wikidata中法官相关实体的RDF转储数据,由wdumper工具生成。包含3845个实体、88346条陈述和879361条三元组,共4个文件,涵盖实体信息、陈述数据及转储元数据,为语义网研究和应用提供结构化数据支持。 文件详解 info.json 文件格式:JSON...
-
SBES2025_Based_巴西软件架构师职业特征研究数据集
数据集概述 本数据集为SBES 2025会议论文配套数据,包含基于巴西招聘广告分析的软件架构师职业特征研究数据。数据采用W3C标准的CSV on the Web(CSVW)格式结构化存储,附描述性元数据以支持语义集成与复用。 文件详解 文件名称:data.zip 文件格式:ZIP(压缩包) 内容说明:压缩包内包含3个遵循W3C...
-
Europarl_v7_Based_英葡CBOW词向量模型数据
数据集概述 本数据集包含基于Europarl语料库(版本7)训练的英语和葡萄牙语CBOW词向量模型,使用FastText工具及子词选项,共40轮训练。数据集含模型文件、词汇向量文件及词汇邻居变化记录文件,可用于自然语言处理相关研究与应用。 文件详解 英语模型文件 文件名称:cbowN_europarl_v7_en_sub_epoch_40.bin...
-
Wikidata_Dump_Based知识图谱RDF转储数据集
数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF格式转储文件,包含4个文件,涵盖数据元信息、转储规范、预览数据等内容,为Wikidata数据的解析与应用提供结构化资源。 文件详解 元信息文件:info.json 文件格式:JSON...
-
Wikidata_Based_RDF格式Dump数据_原始数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF格式Dump数据,包含4个文件,涵盖配置信息、规格说明、压缩数据文件和预览文件,可用于Wikidata知识库相关的数据存储与处理场景。 文件详解 info.json 文件格式:JSON...
-
IN02033_EpiDoc_布达尼尔坎塔石刻铭文梵语XML数据
数据集概述 本数据集为IN02033布达尼尔坎塔石刻铭文的梵语XML文件,属于EpiDoc格式的草稿版本,将纳入"Siddham"档案。数据未包含元数据,仅提供铭文的文本内容数字化记录,是研究该古铭文的基础文本资料。 文件详解 文件名称:IN02033.xml 文件格式:XML...
-
Wikidata_WDumper_Based_RDF格式转储数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含四个文件,涵盖实体、陈述、三元组等信息的结构化记录。数据无实体、陈述和三元组计数,文件类型包括JSON、NT和压缩文件,可用于知识图谱构建与语义数据处理。 文件详解 配置与元数据文件 文件名称:info.json 文件格式:JSON...
-
Wikidata_Based_Wikidata知识库数据Dump
数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含4个文件,涵盖JSON、NT、GZ等格式,主要记录Wikidata的实体、标签、陈述等元数据信息,当前实体、陈述及三元组计数均为0。 文件详解 文件名称:info.json 文件格式:JSON...
-
Wikidata_Dump_Based维基数据RDF转储测试数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储测试数据,包含4个文件,涵盖JSON配置文件、NT格式预览文件及压缩的RDF数据文件。无实际实体、陈述或三元组数据,主要用于验证Wikidata转储流程和文件结构。 文件详解 配置与信息文件(JSON格式) 文件名称:info.json 文件格式:JSON...
-
Wikidata_Based_政治家_企业家_商人RDF转储数据
数据集概述 本数据集是通过wdumper工具生成的Wikidata RDF转储,包含政治家、企业家、商人三类实体的结构化数据,涵盖实体信息、陈述及三元组关系,可用于知识图谱构建与语义分析。 文件详解 info.json 文件格式:JSON...
-
Irish_Rumour_Based_谣言立场分类公开测试集数据
数据集概述 本数据集是针对谣言立场分类任务构建的公开测试集,与现有RumourEval数据集在词汇分布和立场分布上存在显著差异,适用于领域偏移下的模型评估或适应研究,包含2个JSON格式文件。 文件详解 annotation.json 文件格式:JSON...
-
Wikidata_Based_西班牙文化遗产纪念碑RDF转储数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,聚焦于西班牙文化遗产纪念碑相关内容。包含实体、声明及三元组信息,通过结构化文件存储,为西班牙文化遗产研究提供标准化数据支持。 文件详解 配置与元数据文件 文件名称:info.json 文件格式:JSON...
-
CMIP6_IPCC_AR6_WGI图4_22数据使用与引用记录
数据集概述 本数据集记录IPCC第六次评估报告第一工作组(AR6 WGI)图4.22生成所用的CMIP6输入数据使用及引用信息,包含数据集标识、引用DOI、长期存档信息等结构化内容,支持数据溯源与合规引用,共含2个文件。 文件详解 文件名称:fig_4_22.csv 文件格式:CSV...
-
FrameNet_Based_事实主张结构化语义框架建模标注数据
数据集概述 本数据集是Berkeley FrameNet的扩展,用于事实主张的结构化语义建模。包含11个新增人工构建框架与9个现有FrameNet框架(均针对事实核查设计),以及2540条全标注句子,可用于理解框架应用逻辑与训练机器学习模型。 文件详解 核心框架文件...
-
ERC_Cog_PROMENADE_Based_隐喻语料库数据集
数据集概述 本数据集是ERC_Cog PROMENADE项目WP1的隐喻语料库,由NEPLab收集整理,整合日常隐喻(464条)和文学隐喻(533条)两类实验研究数据,支持通过专用ShinyApp查询,共包含13个文件,可用于隐喻认知与神经语言学研究。 文件详解 文档文件(document_files) 文件名称:README archive.md...
-
Wikidata_P279_Based知识图谱关系RDF转储数据
数据集概述 本数据集是基于wdumps工具生成的Wikidata P279关系RDF转储数据,包含4个文件,涵盖数据规格、元信息、压缩数据及预览数据四类内容,可用于知识图谱构建、语义关系分析等场景。 文件详解 文件名称:info.json 文件格式:JSON...
-
Wikidata_Based_Wikidata转储RDF文件数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储文件,包含实体、陈述、三元组等结构化知识数据。数据以多种格式存储,涵盖配置说明、元数据及预览文件,总计四个文件,可用于知识图谱构建、语义分析等场景。 文件详解 文件名称:info.json 文件格式:JSON...
-
Pedalion_Based_古希腊悲剧_美狄亚_依存句法树库数据
数据集概述 本数据集是基于欧里庇得斯悲剧《美狄亚》构建的古希腊语依存句法树库,由Toon Van Hal主导标注,KU Leuven 2018-2019学年三年级本科生参与标注工作,原始文本预处理由Alek Keersmaekers完成。数据集包含一个XML格式文件,用于记录文本的依存句法结构标注信息。 文件详解...
-
Wiki_misc_Based_Wikidata_RDF转储文件集
数据集概述 本数据集为通过wdumps工具生成的Wikidata RDF转储文件集(wiki_misc),包含4个文件,涵盖配置文件、规范文件、压缩数据文件及预览文件。数据记录了转储的元信息、生成参数及示例数据,可用于了解Wikidata转储的结构与格式。 文件详解 配置与元信息文件 文件名称:info.json 文件格式:JSON...



