-
欧洲文学文本集_法国小说语料库2021
2025年12月20日 30 60 51
数据集概述 本数据集是欧洲文学文本集(ELTeC)的法国小说语料库,由COST Action“欧洲文学史的远读”项目制作,版本为v1.0.1。包含法国小说文本及元数据,所有文本均属于公有领域,为文学研究提供标准化语料支持。 文件详解 该数据集包含三个文件,具体说明如下: - 文件名称: ELTeC-fra_metadata.tsv - 文件格式:...
-
欧洲文学文本集合2021年4月版
2025年12月18日 30 199 109
数据集概述 本数据集为2021年4月发布的欧洲文学文本集合(ELTeC)1.1.0版本,包含十四种欧洲语言的小说集合,其中八种语言的小说数量达一百部,总计超过一千二百部小说,为欧洲文学远程阅读研究提供多语言文本资源支持。 文件详解...
-
欧洲文学文本语料库英文小说数据集2021
2025年12月14日 30 31 22
数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
-
塞尔维亚小说语料库2021年4月版
2025年12月4日 30 131 129
数据集概述 该数据集是2021年4月发布的塞尔维亚小说语料库(ELTeC-srp),包含90部以一级编码标注的小说文本,属于欧洲文学文本集合(ELTeC)的一部分,由COST Action项目推动构建。 文件详解 README.md(Markdown格式):包含语料库版本信息、发布说明、DOI引用链接及项目背景介绍,帮助用户理解数据集的来源与使用规范。...



