Crow_Based_1931年中国报纸目录原始与清洗数据

数据集概述

本数据集包含从Carl Crow 1931年版《中国报纸目录》中提取的两份文件,分别为原始提取数据和经过校正、清洗与标准化的版本。每份文件的每一行对应一个独特的报刊标题,记录了报刊名称(含英文、威妥玛拼音、中文、汉语拼音)、出版地(城市、省份)、创刊年份、发行量、出版商名称及简介、页数与尺寸、栏数与尺寸等信息。

文件详解

  • 原始数据文件
  • 文件名称:Crow_1931_raw.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含从Freizo提取的原始数据,记录报刊的名称(英文、威妥玛拼音、中文、汉语拼音)、出版地、创刊年份、发行量、出版商信息、页数与尺寸、栏数与尺寸等基础字段。
  • 清洗数据文件
  • 文件名称:Crow_zenodo_1931.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:含三个标签页,第一页为清洗后的报刊列表数据;第二页描述变量信息;第三页说明用于分析的分类标准(如时期、格式等)。

数据来源

Carl Crow's Newspaper Directory of China (1931 edition)

适用场景

  • 中国近代报业史研究:分析1931年中国报纸的出版分布、发行量及出版特征。
  • 历史出版地理研究:基于出版地数据,探究民国时期报纸的区域分布规律。
  • 文献数据标准化研究:对比原始与清洗数据,研究历史文献数据的校正与标准化方法。
  • 出版商生态分析:通过出版商名称及简介,分析民国时期报业的出版主体特征。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.15 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。