Magnetic_Margins_Based_文本语义分析与知识图谱数据

数据集概述

本数据集为Magnetic Margins项目的分析数据,包含文本注释、章节、副本的结构化CSV文件,以及描述文本变体、编辑修正的PDF文档,还提供RDF语义编码文件和知识图谱模型图,支持文本关联与语义分析。

文件详解

  • 结构化数据文件(CSV格式):
  • mm_data_annotations.csv:记录文本副本与章节的关联注释,字段包括copy.Id(副本ID)、concat(substructures.Id)(章节ID列表)、weighted(注释重要性数值)等
  • mm_data_sections.csv:记录文本章节信息,字段包括Id(章节唯一ID)、topic_row(章节主题列表)等
  • mm_data_copies.csv:记录已注释的文本副本列表,字段包括Id(副本唯一ID)及副本元数据
  • 文档文件(PDF格式):
  • mm_data_gilbert_variants-iiiiv.pdf:描述Gilbert语料库中的文本变体
  • mm_data_gilbert-editorial-corrections.pdf:记录对Gilbert 1600年版的编辑修正
  • 语义编码文件(ZIP格式):
  • mm_data_ttl.zip:包含TTL(简洁三元组语言)文件,用于RDF语义编码
  • 模型文件(ZIP格式):
  • mm_data-model.zip:包含知识图谱底层模型的简化本体图(静态图片)

适用场景

  • 文本语义分析:通过RDF三元组数据研究文本元素间的关联关系
  • 文献版本研究:利用文本变体与编辑修正文档分析Gilbert著作的版本演变
  • 知识图谱构建:基于本体模型与结构化数据搭建文本知识图谱
  • 文本注释研究:分析文本副本与章节的关联注释逻辑及重要性评估
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.98 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。