d_RoRo_Based_德国浪漫主义小说标注语料库_完整版

数据集概述

本数据集为d-Romane-Romantik(d-RoRo)语料库,包含115部德语浪漫主义小说,总计约1266万词元。语料库分为核心语料库、补充语料库I和补充语料库II,涵盖经典与非经典作家作品,时间跨度为1776年至1854年。数据包含纯文本文件及元数据表格,由达姆施塔特工业大学forTEXT实验室于2020-2022年整理,用于浪漫主义文学研究。

文件详解

  • 文件名称:Romane.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内含两类文件,一是德国浪漫主义小说的纯文本文件,二是元数据表格,包含作者姓名、作品标题、版本信息、首版时间、作者生平与性别、文本体裁、词元数量等核心元数据。

数据来源

达姆施塔特工业大学forTEXT实验室

适用场景

  • 浪漫主义文学风格分析: 对比经典与非经典浪漫主义小说的语言特征、叙事结构差异。
  • 文学经典化研究: 分析核心语料库与补充语料库中作家的经典化状态及其作品传播度。
  • 性别文学研究: 基于元数据的作者性别信息,探究浪漫主义时期不同性别作家的创作差异。
  • 文学分期研究: 结合作品首版时间,验证浪漫主义时期的时间边界(1790-1850年)及其文学特征演变。
  • 通俗文学研究: 分析补充语料库II中历史小说、骑士小说等通俗文学类型的文本特征。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 45.73 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。