找到2个数据集

格式: ZIP 标签: 计量文体学

过滤结果
  • 欧洲文学文本集合2021年4月版

    2025年12月18日 30 146 38

    数据集概述 本数据集为2021年4月发布的欧洲文学文本集合(ELTeC)1.1.0版本,包含十四种欧洲语言的小说集合,其中八种语言的小说数量达一百部,总计超过一千二百部小说,为欧洲文学远程阅读研究提供多语言文本资源支持。 文件详解...
    packageimg
  • 数据18世纪法国小说数据集1751_1800

    2025年12月14日 30 200 192

    数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
    packageimg