-
TEI编码数字版本通用处理与呈现数据集
2025年12月18日 30 113 12
数据集概述 本数据集为2014年TEI会员会议报告的基础资料,聚焦TEI编码数字版本的处理与呈现问题。通过分析现有编码文本的元素使用情况,探讨基于文本类型和编码目的实现通用呈现的可能性,为TEI文本互操作性研究提供数据支持。 文件详解 该数据集包含四类文件,具体说明如下: - HTML文件(共5个): -...
-
范妮_门德尔松致威廉_亨塞尔书信转录数据集
2025年12月14日 30 24 17
数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
-
WeGA数据包裹_Carl_Maria_von_Weber全集数字版
2025年12月14日 30 36 5
数据集概述 本数据集是Carl-Maria-von-Weber全集(Carl-Maria-von-Weber-Gesamtausgabe)的数字版,包含TEI和MEI格式文档。数据从内部WeGA TEI格式转换而来,符合TEI_all和mei_all标准,保留全部信息,内部引用通过URI实现。 文件详解...
-
数据18世纪法国小说数据集1751_1800
2025年12月14日 30 181 88
数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
-
Softcite数据集_研究出版物中的软件提及标注数据集
2025年12月4日 30 164 156
数据集概述 该数据集是研究出版物中软件提及的标注数据集,包含生物医学和经济学领域开放获取文献中的软件提及标注,涉及软件名称、版本、访问URL等信息,以TEI/XML格式存储,还包含描述数据集设计与创建过程的论文。 文件详解 文件名称:howisonlab/softcite-dataset-v1.0.zip 文件格式:ZIP压缩包 压缩包内包含:...



