数据集概述
本数据集通过从西班牙劳工法规中抽取法律事件与关系,并将其结构化为RDF图。使用GPT-3.5的5-shot学习方法处理法规全文,提取约1500条关系,以JSON格式存储并转换为RDF表示,包含4个文件,支持法律知识图谱相关研究与应用。
文件详解
- status-events.json
- 文件格式:JSON
- 字段映射介绍:存储从西班牙劳工法规中抽取的约1500条法律关系数据,包含事件提及、主体、客体、补全信息、触发词及关系类型等核心字段。
- statute-events-rdf.nt
- 文件格式:NT(N-Triples)
- 字段映射介绍:以RDF三元组格式存储的法律关系数据,每条记录为“主语-谓语-宾语”结构,用于RDF图数据的解析与应用。
- statute-events-rdf.ttl
- 文件格式:TTL(Turtle)
- 字段映射介绍:以Turtle格式存储的RDF数据,支持更易读的RDF图表示,包含命名空间定义及结构化的法律关系三元组。
- statute-events-dataset.csv
- 文件格式:CSV
- 字段映射介绍:包含event_mention(事件提及)、event_subject(事件主体)、event_subject_id(主体ID)、event_subject_type(主体类型)、event_object(事件客体)、event_object_id(客体ID)、event_object_type(客体类型)、event_complement(事件补全)、event_complement_id(补全ID)、event_trigger(事件触发词)、event_trigger_id(触发词ID)、relation_type(关系类型)等字段,结构化呈现抽取的法律关系数据。
适用场景
- 法律知识图谱构建:基于RDF格式数据构建西班牙劳动法领域的知识图谱,支持法律概念关联与查询。
- 法律文本关系抽取研究:分析GPT-3.5在法律文本少样本学习场景下的关系抽取效果,优化模型方法。
- 劳动法智能应用开发:为西班牙劳工法规相关的智能问答、合规检查等应用提供结构化数据支撑。
- 法律数据标准化研究:探索法律文本到RDF结构化数据的转换流程与规范,提升法律数据 interoperability。