找到8个数据集

标签: ELTeC

过滤结果
  • ELTeC_德国小说语料库_2021年4月发布版

    2026年2月1日 30 82 39

    数据集概述 本数据集为欧洲文学文本集(ELTeC)的德国小说语料库2021年4月发布版,包含100部按1级编码的小说,共3个文件,无目录结构。数据支持欧洲文学的远程阅读研究,涵盖小说元数据与编码文本,可用于文学特征分析与比较研究。 文件详解 文件名称:README.md 文件格式:MD...
    packageimg
  • ELTeC_gsw_Based_瑞士德语小说集_公开数据集

    2026年1月30日 30 147 94

    数据集概述 本数据集是欧洲文学文本集合(ELTeC)的瑞士德语小说子集,由COST Action "Distant Reading for European Literary History"项目生成,包含100部符合语料库构成标准的瑞士德语小说,采用TEI编码,支持欧洲文学远程阅读研究,总计102个文件。 文件详解 核心数据文件...
    packageimg
  • ELTeC_hun_Based_匈牙利小说语料库数据2021_04

    2026年1月27日 30 159 138

    数据集概述 本数据集为ELTeC(欧洲文学文本集)项目下的匈牙利小说语料库2021年4月版本,包含100部编码为1级和2级的小说,总计2个文件,无目录层级结构。数据由欧洲文学历史远程阅读COST行动项目产出,支持欧洲文学的数字化研究。 文件详解 README.md 文件格式:MD...
    packageimg
  • ELTeC_pol_Based_波兰小说语料库_2021年4月发布版

    2026年1月26日 30 123 109

    数据集概述 本数据集是ELTeC(欧洲文学文本集合)的波兰语小说语料库2021年4月发布版,包含100部波兰语小说。数据集支持欧洲文学远程阅读研究,由COST Action CA16204项目产出,所有文本均属于公有领域,可用于文学文本分析、语言研究等场景。 文件详解 文件名称:README.md 文件格式:MD...
    packageimg
  • 欧洲文学文本集_法国小说语料库2021

    2025年12月20日 30 46 7

    数据集概述 本数据集是欧洲文学文本集(ELTeC)的法国小说语料库,由COST Action“欧洲文学史的远读”项目制作,版本为v1.0.1。包含法国小说文本及元数据,所有文本均属于公有领域,为文学研究提供标准化语料支持。 文件详解 该数据集包含三个文件,具体说明如下: - 文件名称: ELTeC-fra_metadata.tsv - 文件格式:...
    packageimg
  • 欧洲文学文本集合2021年4月版

    2025年12月18日 30 164 15

    数据集概述 本数据集为2021年4月发布的欧洲文学文本集合(ELTeC)1.1.0版本,包含十四种欧洲语言的小说集合,其中八种语言的小说数量达一百部,总计超过一千二百部小说,为欧洲文学远程阅读研究提供多语言文本资源支持。 文件详解...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日 30 84 78

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • 塞尔维亚小说语料库2021年4月版

    2025年12月4日 30 196 131

    数据集概述 该数据集是2021年4月发布的塞尔维亚小说语料库(ELTeC-srp),包含90部以一级编码标注的小说文本,属于欧洲文学文本集合(ELTeC)的一部分,由COST Action项目推动构建。 文件详解 README.md(Markdown格式):包含语料库版本信息、发布说明、DOI引用链接及项目背景介绍,帮助用户理解数据集的来源与使用规范。...
    packageimg