ELTeC_nor_Based_挪威小说语料库2021年4月版

数据集概述

本数据集为欧洲文学文本集合(ELTeC)的挪威语分支(ELTeC-nor)2021年4月发布版本,包含53部以1级编码的挪威小说。数据集提供语料库文件、元数据及说明文档,支持欧洲文学远程阅读研究,共含3个文件。

文件详解

  • README.md
  • 文件格式:MD
  • 字段映射介绍:包含语料库基本信息、发布说明、版本历史及引用DOI(10.5281/zenodo.3521571),关联COST Action Distant Reading项目背景
  • metadata.csv
  • 文件格式:CSV
  • 字段映射介绍:含id(语料ID)、author-name(作者名)、book-title(书名)、subgenre(子类型)、year(年份)、year-cat(年份分类)、canon-cat(经典分类)、gender-cat(性别分类)、length(长度)、length-cat(长度分类)、counter(计数器)字段
  • ELTeC-nor-0.5.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内为53部挪威小说的1级编码文本文件,具体内容需解压后查看

数据来源

COST Action Distant Reading for European Literary History(CA16204)

适用场景

  • 欧洲文学远程阅读研究:用于分析挪威小说的文学特征、作者群体及创作趋势
  • 文学元数据分析:通过metadata.csv的年份、性别、长度等字段,探究挪威小说的出版规律与分类特征
  • 语料库语言学研究:基于编码文本文件,开展挪威语文学文本的语言结构、词汇使用等分析
  • 学术引用与合作:通过DOI引用支持文学研究论文的语料来源标注,助力跨机构研究合作
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.55 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。