西班牙国家图书馆19世纪末文化杂志数据集_CORSMAXIX

数据集概述

本数据集收录西班牙国家图书馆藏1898-1899年间三种19世纪末西班牙文化杂志的48期内容,包含短篇故事、诗歌、评论及社会政治散文,覆盖西班牙政治文化转型关键时期,为人文社科领域的计算分析提供丰富语料支持。

文件详解

  • 索引文件(CSV格式):
  • CORSMAXIX_la_vida_literaria_index.csv:《La vida literaria》杂志期号索引,字段含Contributors_Documented(记录作者)、Title(文章标题)、Magazine(杂志名)、Issue(期号)、Year(年份)、Contributors_Original(原始作者署名)
  • CORSMAXIX_la_vida_galante_index.csv:《La vida galante》杂志期号索引,字段同上
  • CORSMAXIX_vida_nueva_index.csv:《Vida nueva》杂志期号索引,字段同上
  • 作者信息文件:
  • CORSMAXIX_contributors_original_and_contributors_documented.csv(CSV格式):原始作者与记录作者对应表
  • CORSMAXIX_contributors_ID_gender_country_birth_death.xlsx(Excel格式):作者ID及性别、国家、生卒年份等传记信息(若有)
  • 文本文件:
  • CORSMAXIX_Plain_Text.zip(压缩包格式):包含789个.txt文件,为提取并标准化后的杂志原文文本
  • 标识符文件:
  • CORSMAXIX_BNE_PID.xlsx(Excel格式):各杂志期号对应的西班牙国家图书馆永久标识符(PIDs)列表
  • 代码文件(Python脚本):
  • Python1_Index.py、Python2_Author_Documentation.py、Python3_Author_Documentation_RevCult.py、Python4_Splitted_Contributions.py、Python5_contributors_magazine.py、Python6_contributors_country.py:共6个.py文件,用于数据处理相关操作

数据来源

西班牙国家图书馆

适用场景

  • 数字人文研究:分析19世纪末西班牙文化杂志的文本特征与创作趋势
  • 社会史研究:探究转型期西班牙社会政治思想的传播与演变
  • 计算语言学应用:开展作者归属、文本分类等自然语言处理任务
  • 出版史研究:梳理19世纪末西班牙期刊出版生态与作者网络
  • 跨语料库关联研究:与其他同期期刊语料库整合,拓展人文社科领域的宏观分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.54 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。