Deepex_Supplementary_Zero_Shot信息抽取文本转三元组补充数据集

数据集概述

本数据集是Zero-Shot信息抽取任务(统一为文本转三元组翻译任务)的补充数据,支持Deepex模型相关研究。包含3个文件,覆盖JSON和CSV格式,无训练/测试、数据/标签等划分,核心内容为信息抽取所需的文本与三元组映射数据。

文件详解

  • 文件名称:wk_q2name.json
  • 文件格式:JSON
  • 字段映射介绍:推测为维基数据中实体QID与名称的映射数据
  • 文件名称:TREx_lama.csv
  • 文件格式:CSV
  • 字段映射介绍:包含文本片段与三元组信息,示例内容为人物生平文本对应"实体-关系-属性值"三元组(如"Allan Peiper-place of birth-Alexandra")
  • 文件名称:wk_p2name.json
  • 文件格式:JSON
  • 字段映射介绍:推测为维基数据中关系PID与名称的映射数据

适用场景

  • Zero-Shot信息抽取模型训练: 用于训练将文本转化为三元组的信息抽取模型
  • 文本转三元组任务研究: 支持统一文本到三元组翻译的任务设计与评估
  • 知识库构建辅助: 利用文本与三元组映射数据补充知识库实体关系
  • 自然语言处理数据集扩展: 为信息抽取领域提供多样化的补充训练数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 820.05 MiB
最后更新 2026年1月17日
创建于 2026年1月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。