数据集概述
本数据集包含约瑟夫于圣诞夜在亨纳斯多夫晚间集会的讲道文本转录数据,源自Herrnhut Unitätsarchiv提供的《Gemein-Nachrichten》数字化内容。数据以XML-TEI格式的转录文件、增强元数据的转录文件、标准化文本文件及带注释的转录文件呈现,支持宗教文献研究与文本分析。
文件详解
- 文件名称:00885_01.xml
- 文件格式:XML-TEI
- 字段映射介绍:基于原始数字化资料转录的XML-TEI导出文件,包含讲道文本的基础转录内容。
- 文件名称:00885_02.xml
- 文件格式:XML-TEI
- 字段映射介绍:添加元数据的转录文件,在基础转录内容上补充标准化元数据字段。
- 文件名称:00885_03.docx
- 文件格式:DOCX
- 字段映射介绍:标准化文本文件,适用于机器分析等进一步使用场景。
- 文件名称:00885_04.xml
- 文件格式:XML-TEI
- 字段映射介绍:添加元数据和词汇表注释的增强转录文件,包含更丰富的文本标注信息。
数据来源
Unitätsarchiv Herrnhut(赫恩胡特联合档案馆)
适用场景
- 宗教历史研究:分析18世纪末至19世纪初赫恩胡特兄弟会的讲道内容与宗教思想传播。
- 文本数字化与元数据研究:探索XML-TEI格式在宗教文献转录与元数据标注中的应用。
- 宗教集会文本分析:通过标准化文本文件开展讲道文本的主题、语言风格等机器分析。
- 兄弟会历史文献整理:作为《Gemein-Nachrichten》数字化资源的一部分,支持兄弟会历史文献的整合研究。