欧洲文学文本集合2021年4月版

数据集概述

本数据集为2021年4月发布的欧洲文学文本集合(ELTeC)1.1.0版本,包含十四种欧洲语言的小说集合,其中八种语言的小说数量达一百部,总计超过一千二百部小说,为欧洲文学远程阅读研究提供多语言文本资源支持。

文件详解

  • README.md:文档格式,说明该数据集为ELTeC发布的总览仓库,仅引用各语言文本集合,不包含实际小说文件,提供数据集引用信息及背景介绍
  • ELTeC-1.1.0.zip:压缩包格式,可能为数据集的打包文件

数据来源

COST Action Distant Reading for European Literary History (CA16204)

适用场景

  • 欧洲比较文学研究:分析不同语言文学作品的主题、风格差异
  • 计算语言学研究:用于多语言文本的特征提取、语言模型训练
  • 数字人文研究:支持文学文本的远程阅读、计量文体学分析
  • 文学历史研究:探究欧洲不同时期小说的发展脉络与文化背景
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.02 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。