数据集概述
本数据集收录西班牙国家图书馆藏1898-1899年间三种19世纪末西班牙文化杂志的48期内容,包含短篇故事、诗歌、评论及社会政治散文,覆盖西班牙政治文化转型关键时期,为人文社科领域的计算分析提供丰富语料支持。
文件详解
- 索引文件(CSV格式):
- CORSMAXIX_la_vida_literaria_index.csv:《La vida literaria》杂志期号索引,字段含Contributors_Documented(记录作者)、Title(文章标题)、Magazine(杂志名)、Issue(期号)、Year(年份)、Contributors_Original(原始作者署名)
- CORSMAXIX_la_vida_galante_index.csv:《La vida galante》杂志期号索引,字段同上
- CORSMAXIX_vida_nueva_index.csv:《Vida nueva》杂志期号索引,字段同上
- 作者信息文件:
- CORSMAXIX_contributors_original_and_contributors_documented.csv(CSV格式):原始作者与记录作者对应表
- CORSMAXIX_contributors_ID_gender_country_birth_death.xlsx(Excel格式):作者ID及性别、国家、生卒年份等传记信息(若有)
- 文本文件:
- CORSMAXIX_Plain_Text.zip(压缩包格式):包含789个.txt文件,为提取并标准化后的杂志原文文本
- 标识符文件:
- CORSMAXIX_BNE_PID.xlsx(Excel格式):各杂志期号对应的西班牙国家图书馆永久标识符(PIDs)列表
- 代码文件(Python脚本):
- Python1_Index.py、Python2_Author_Documentation.py、Python3_Author_Documentation_RevCult.py、Python4_Splitted_Contributions.py、Python5_contributors_magazine.py、Python6_contributors_country.py:共6个.py文件,用于数据处理相关操作
数据来源
西班牙国家图书馆
适用场景
- 数字人文研究:分析19世纪末西班牙文化杂志的文本特征与创作趋势
- 社会史研究:探究转型期西班牙社会政治思想的传播与演变
- 计算语言学应用:开展作者归属、文本分类等自然语言处理任务
- 出版史研究:梳理19世纪末西班牙期刊出版生态与作者网络
- 跨语料库关联研究:与其他同期期刊语料库整合,拓展人文社科领域的宏观分析