CalDraCor_Based_戏剧语料库_2_0_0版本数据

数据集概述

本数据集为CalDraCor v2.0.0版本,是Calderón戏剧语料库项目的更新版本。该项目由图宾根大学罗曼语研究研讨会与数字人文中心合作发起,2023年由图宾根和斯图加特研究人员在DFG资助项目支持下更新,主要优化了戏剧结构拆分、角色注释、性别标注、类型分类及拼写修正等内容。

文件详解

  • 文件名称:arojascastro/caldracor-v2.0.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含CalDraCor v2.0.0版本的戏剧语料库数据,具体内容未提供预览,根据描述推测包含经过拆分(幕拆分为场景)、角色注释(含角色信息)、性别标注修正、类型分类(基于Kroll分类)及拼写错误修正的戏剧文本数据。

数据来源

图宾根大学罗曼语研究研讨会与数字人文中心合作项目,2023年DFG资助项目“Tracing Regularities in Pedro Calderón de la Barca’s Dramatic Oeuvre with a Computational Approach”

适用场景

  • 戏剧文学文本分析: 用于研究Pedro Calderón de la Barca戏剧作品的文本结构、语言特征及创作规律。
  • 角色网络分析: 基于角色注释信息,分析戏剧中角色关系与互动网络。
  • 戏剧类型研究: 利用类型分类数据,探究不同戏剧类型的特征与演变。
  • 计算语言学应用: 作为语料库支持戏剧文本的计算语言学研究,如词性标注、句法分析等。
  • 性别研究: 基于修正后的角色性别标注,分析戏剧中的性别表征与叙事差异。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 7.93 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。