找到5个数据集

分类: 公开数据 标签: 书名

过滤结果
  • ELTeC_德国小说语料库_2021年4月发布版

    2026年2月1日 30 10 4

    数据集概述 本数据集为欧洲文学文本集(ELTeC)的德国小说语料库2021年4月发布版,包含100部按1级编码的小说,共3个文件,无目录结构。数据支持欧洲文学的远程阅读研究,涵盖小说元数据与编码文本,可用于文学特征分析与比较研究。 文件详解 文件名称:README.md 文件格式:MD...
    packageimg
  • ELTeC_nor_Based_挪威小说语料库2021年4月版

    2026年1月28日 30 60 21

    数据集概述 本数据集为欧洲文学文本集合(ELTeC)的挪威语分支(ELTeC-nor)2021年4月发布版本,包含53部以1级编码的挪威小说。数据集提供语料库文件、元数据及说明文档,支持欧洲文学远程阅读研究,共含3个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • El_País_Babelia_Based_年度最佳图书文学报告数据_2010_2020

    2026年1月13日 30 153 96

    数据集概述 本数据集包含2010至2020年每年12月底在西班牙《国家报》(El País)“Babelia”副刊发布的年度最佳图书文学报告,收录含年度最佳图书关键词的公开报告内容,记录作者、书名、类型、出版社、出版年份、出版语言及原始语言等信息,共283条条目。 文件详解 文件名称:DEF Zenodo Els millors 10-20 El...
    packageimg
  • 西班牙语小说语料库2021_04

    2025年12月7日 30 16 12

    数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
    packageimg
  • 罗马尼亚小说语料库2021年4月版

    2025年12月4日 30 159 129

    数据集概述 该数据集是2021年4月发布的罗马尼亚小说语料库(ELTeC-rom),包含95部按第一层级编码的小说,提供了小说元数据、说明文档及压缩文件包,为欧洲文学文本相关研究提供基础数据支持。 文件详解 文件名称: metadata.csv 文件格式: CSV 字段映射: 包含id(编号)、author-name(作者名)、book-...
    packageimg