-
悉昙碑铭档案_EpiDoc格式文本
2025年12月12日 30 34 0
数据集概述 本数据集是悉昙语料库中碑铭文本的EpiDoc(TEI XML)版本归档,包含不同时间点的工作进展版本与最终发布版本,记录了碑铭文本的数字化编辑过程,为碑铭研究提供结构化的文本数据支持。 文件详解 该数据集以版本为单位归档EpiDoc格式的碑铭文本文件,各版本说明如下: -...
-
欧洲文学文本语料库英文小说数据集2021
2025年12月14日 30 45 31
数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
-
Jarāʾid阿拉伯期刊年表数据集1800_1929
2025年12月7日 30 54 42
数据集概述 该数据集是Jarāʾid项目首次发布的文献数据,收录了1800至1929年全球范围内以阿拉伯语(含阿拉伯语加其他语言)出版的所有期刊的文献信息,是项目网站的基础数据支撑。 文件详解 文件名称:ProjectJaraid/jaraid_source-v1.0.zip 文件格式:ZIP压缩包(.zip)...
-
ELTE_Poetry_Corpus_Based_匈牙利经典诗歌多维度特征标注完整数据
2025年12月6日 30 31 17
数据集概述 该数据集为ELTE诗歌语料库,包含匈牙利53位经典诗人的14358首完整诗歌,涵盖词汇语法特征、押韵模式、节奏、头韵等诗歌声音特征,以TEI及非TEI XML格式存储,为诗歌研究提供结构化标注数据。 文件详解 文件名称:poetry-corpus-1.0.zip 文件格式:ZIP压缩包 内部目录及内容: level1:人工校验的TEI...
-
数据17世纪苏黎世Stillstand会议记录TEI_XML数据集
2025年12月5日 30 176 80
数据集概述 本数据集包含17世纪瑞士苏黎世地区Stillstand会议记录的TEI-XML格式数字化文本,记录了当地宗教社区管理机构Stillstand的日常事务、社会治理及民众生活等内容,由原始手写记录转录、转换而来,具有重要历史文献价值。 文件详解 核心数据文件:...



