-
Oupoco_Based_法语十四行诗库_文学创作数据
2026年1月30日 30 46 28
数据集概述 本数据集是Oupoco项目框架下开发的法语十四行诗库,包含四千八百七十首十四行诗,主要来自十九世纪至二十世纪初。涵盖七百六十七位作者,其中男性作者六百六十位(四千四百一十二首)、女性作者一百零七位(四百三十九首),另有十九首作者性别未明确。数据可免费复用,支持文学研究、语料库分析等多场景应用。 文件详解 文件名称:oupoco.dtd...
-
Marian_Keyes_Based小说专有名词提取分析数据集2020
2026年1月23日 30 82 49
数据集概述 本数据集为爱尔兰研究委员会资助的博士论文相关研究成果,分析了Marian Keyes1995-2020年出版的14部小说中的专有名词,包含角色名称等内容。虽结果无统计显著性未纳入最终论文,但可为其他研究者提供角色名称停用词表,支持远读方法分析。 文件详解 文件名称:An analysis of proper nouns in Marian...
-
伊比利亚文学文本跨文化探索研究语料库
2025年12月13日 30 66 1
数据集概述 本数据集是一个文学语料库,作为博士论文《文学文本的跨文化阅读:西班牙语作为外语大学课堂中伊比利亚关系的表征》的组成部分,聚焦于从跨文化视角研究伊比利亚文学文本。 文件详解 文件名称: Corpus literario para la investigación sobre las relaciones entre los textos...
-
欧洲文学文本语料库英文小说数据集2021
2025年12月14日 30 195 73
数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
-
斯洛文尼亚小说语料库2021年4月版
2025年12月8日 30 203 166
数据集概述 该数据集是2021年4月发布的斯洛文尼亚小说语料库,包含一百部小说,均采用一级和二级编码。数据内容与上一版本保持一致,为欧洲文学文本相关研究提供结构化的文学文本资源。 文件详解...
-
西班牙语小说语料库2021_04
2025年12月7日 30 54 11
数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
-
塞尔维亚小说语料库2021年4月版
2025年12月4日 30 41 34
数据集概述 该数据集是2021年4月发布的塞尔维亚小说语料库(ELTeC-srp),包含90部以一级编码标注的小说文本,属于欧洲文学文本集合(ELTeC)的一部分,由COST Action项目推动构建。 文件详解 README.md(Markdown格式):包含语料库版本信息、发布说明、DOI引用链接及项目背景介绍,帮助用户理解数据集的来源与使用规范。...
-
巴西葡萄牙语文学语料库数据集
2025年4月17日 30 80 63
巴西葡萄牙语文学语料库数据集 数据来源:互联网公开数据 标签:巴西文学,葡萄牙语,文学语料库,文本分析,主题识别,作者归属,历史文本,文化研究 数据概述 本数据集收录了1840年至1908年间巴西文学作品,内容涵盖超过370万字的葡萄牙语文本,涉及81部独立作品。这些作品由多位知名巴西作家创作,包括阿道福·坎尼亚(Adolfo...



