数据集概述
本数据集包含《Arden of Faversham》与Martin Mueller语料库“Shakespeare His Contemporaries”中其他早期现代戏剧的短语重复排名数据。通过量化两部戏剧间共享短语的数量和类型,为文学研究者提供文本关联分析的结构化参考。数据集含2个文件,覆盖核心对比指标。
文件详解
- 文件名称:ardenpairwisevalues.csv
- 文件格式:CSV
- 字段映射介绍:包含playdater1(戏剧1日期编码)、playdater2(戏剧2日期编码)、title1(戏剧1标题)、title2(戏剧2标题)、author1(戏剧1作者)、author2(戏剧2作者)、repcount(重复短语数量)、repvalue(重复值)、adjustedrepvalue(调整后重复值)等字段
- 文件名称:ardenpairwisevalues.xlsx
- 文件格式:XLSX
- 字段映射介绍:与CSV文件内容一致,为Excel格式的结构化数据,便于表格编辑与可视化
数据来源
Martin Mueller语料库“Shakespeare His Contemporaries”
适用场景
- 早期现代戏剧作者归属研究:通过短语重复值分析《Arden of Faversham》与其他戏剧的文本关联,辅助作者身份考证
- 戏剧文本影响研究:量化分析不同戏剧间的短语共享模式,探究作品间的互文关系与影响路径
- 文学语料库对比分析:作为结构化数据支撑早期现代戏剧语料库的文本相似度与风格比较研究
- 数字人文教学实践:为数字文学分析课程提供标准化的文本对比数据集,用于教学演示与实操训练