悉昙碑铭档案_EpiDoc格式文本

数据集概述

本数据集是悉昙语料库中碑铭文本的EpiDoc(TEI XML)版本归档,包含不同时间点的工作进展版本与最终发布版本,记录了碑铭文本的数字化编辑过程,为碑铭研究提供结构化的文本数据支持。

文件详解

该数据集以版本为单位归档EpiDoc格式的碑铭文本文件,各版本说明如下: - 20170730版本:含三百一十一篇碑铭的EpiDoc文本,TEI头文件为验证用虚拟数据,元数据以独立表格存储 - 20170906版本:含二百一十五篇碑铭的EpiDoc文本,TEI头文件集成悉昙数据库中的大部分元数据 - 20171118版本:含三百一十一篇碑铭的EpiDoc文本,TEI头文件集成悉昙数据库中的大部分元数据 - 20190130版本:接近完整的碑铭集合(不含大部分尼泊尔记录),TEI头文件仅含标题与ID号 - 20190221版本:数据库入库前的最终离线编辑版本,TEI头文件仅含标题与ID号,元数据以独立表格存储,包含IN00001至IN00203等编号的碑铭文本(如《Allahabad Praśasti of Samudragupta》《Eran Stone Inscription of Samudragupta》等)

适用场景

  • 碑铭学研究:用于悉昙碑铭文本的数字化分析与解读
  • 历史文献整理:辅助古代碑铭文献的电子化归档与版本追溯
  • 数字人文研究:探索EpiDoc格式在碑铭文本标准化处理中的应用
  • 语言学分析:支持悉昙文字及相关语言特征的学术研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.0 MiB
最后更新 2025年12月18日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。