-
SamaritanChronicle_Based_列王纪上下特征文本数据
2026年1月21日 30 154 48
数据集概述 本数据集为撒玛利亚编年史(Sepher ha-Yamim)在《列王纪上》《列王纪下》中的特征文本集合,包含所有相关案例,部分案例已按一致模式分组整理,可用于圣经文本研究及版本对比分析。 文件详解 文件名称:SamaritanChronicle_1-2Kgs_Cases_v1.0.xlsx 文件格式:XLSX...
-
哥廷根印度语言电子文本注册库_罗摩衍那数据集
2025年12月25日 30 206 172
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
-
西班牙美洲学术期刊价值观教育数据集2001_2020
2025年12月23日 30 185 70
数据集概述 本数据集对应《西班牙美洲学术期刊价值观教育(2001-2020):数字工具应用研究》一文,包含200篇开放获取文本(PDF或TXT格式),通过REDIB©获取。数据集按出版时间和作者所属国家/机构分为不同语料库,另含参考文献及停用词列表,用于LDAvis主题建模分析。 文件详解 语料库压缩文件(共5个,.zip格式): Corpus A...
-
哥廷根印度语言电子文本注册库_吠檀多数据集
2025年12月24日 30 73 45
数据集概述 该数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于吠檀多(VEDĀNTA)主题的电子文本集合,包含六十一个HTML格式的文本文件,未划分目录结构,为印度语言吠檀多相关文本研究提供基础资料。 文件详解...
-
教父文本档案_古代基督教文本开放获取档案
2025年12月23日 30 186 35
数据集概述 该数据集为“教父文本档案”开放获取资源,包含古代基督教文本的原文及译文,以.zip格式压缩包存储,提供一站式的文本资源集合。 文件详解 该数据集包含一个压缩包文件,具体说明如下: - 文件名称: PatristicTextArchive/pta_data-1.1.12315518284.zip - 文件格式: ZIP (.zip) -...
-
哥廷根印度语言电子文本注册吠陀数据集
2025年12月23日 30 195 186
数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于吠陀(VEDA)的电子文本集合,包含37个HTML格式文件,主要为吠陀相关文本内容,未划分训练测试集、数据标签或原始/处理数据,为印度语言及吠陀文本研究提供基础资料。 文件详解 该数据集包含37个HTML格式文件,具体说明如下: - 文件类型: 所有文件均为.htm格式,占比100%...
-
欧洲文学文本集合2021年4月版
2025年12月18日 30 203 93
数据集概述 本数据集为2021年4月发布的欧洲文学文本集合(ELTeC)1.1.0版本,包含十四种欧洲语言的小说集合,其中八种语言的小说数量达一百部,总计超过一千二百部小说,为欧洲文学远程阅读研究提供多语言文本资源支持。 文件详解...
-
哥廷根印度语言电子文本登记印度法论数据集
2025年12月15日 30 199 58
数据集概述 本数据集是哥廷根印度语言电子文本登记(GRETIL)中关于印度法论(SMṚTI)的电子文本集合,包含46个HTML格式文件,未进行训练测试、数据标签或原始处理数据的划分,文件类型单一为.htm格式。 文件详解 文件类型:以.htm格式为主,共46个文件,占比100%...
-
历史PCM文本语料库附录_18_21世纪
2025年12月14日 30 90 25
数据集概述 本数据集为研究用18至21世纪历史PCM文本语料库的附录文件,包含相关文本内容,以单一PDF格式存储,未划分训练测试或数据标签集。 文件详解 文件名称: Appendix_corpus_of_historic_(18th-21st_century)_PCM_texts.pdf 文件格式: PDF (.pdf) 文件内容:...
-
Korpuslinguistik_Based_Foodblog_Korpus德语美食博客标注完整数据
2025年12月12日 30 172 108
数据集概述 该数据集是《Korpuslinguistik(narr Starter)》教材的配套材料,包含一百五十篇德语美食博客文章及相关元数据、标注文件。数据格式多样,为德语美食博客文本的语言学分析提供了结构化与非结构化相结合的资源。 文件详解 该数据集包含五个文件,具体说明如下: - 文本集合文件: - Foodblog-...
-
土佐日记现代日语及英语翻译数据集
2025年12月12日 30 34 4
数据集概述 本数据集是《土佐日记》的现代日语及英语翻译文本集合,包含原文及对应翻译内容,以JSON格式存储,涵盖标题、作者、段落文本、假名注音、直译与意译等多维度信息,为古典文学翻译与研究提供结构化资源。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: yamagen/tosa-translation-v1.0.0.zip -...
-
哥廷根印度语言电子文本注册_ŚRAUTA数据集
2025年12月11日 30 171 32
数据集概述 本数据集是GRETIL平台收录的印度语言电子文本注册中关于ŚRAUTA主题的文本集合,包含5个HTML格式文件,未区分训练/测试、数据/标签或原始/处理数据,文件类型单一。 文件详解...
-
哥廷根印度语言电子文本注册中心_奥义书数据集
2025年12月11日 30 158 21
数据集概述 该数据集是哥廷根印度语言电子文本注册中心(GRETIL)收录的奥义书(UPANIṢAD)相关电子文本集合,包含三十五个HTML格式文件,无目录层级结构,未划分训练测试、数据标签或原始处理数据。 文件详解 文件类型:均为HTML格式(.htm),共三十五个文件...
-
哥廷根印度语言电子文本注册库_罗摩衍那数据集
2025年12月10日 0 150 68
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...



