人文数据分析补充材料数据集

数据集概述

本数据集是《人文数据分析:使用Python的案例研究》手稿的补充材料,按章节划分文件夹存储相关数据,包含1900年前出版的公有领域文本数据,各数据目录配有说明文档。

文件详解

  • 文件名称: data.zip
  • 文件格式: ZIP (.zip)
  • 文件内容: 压缩包内按章节划分文件夹,每个文件夹包含data目录,目录内有对应章节使用的文本数据及说明其内容的README文件,数据多为1900年前的公有领域文本。

适用场景

  • 人文数据研究: 分析1900年前公有领域文本的内容特征与规律
  • 数字人文教学: 作为Python人文数据分析案例的实践数据
  • 文本挖掘应用: 开展历史文本的预处理、特征提取等技术验证
  • 学术研究支持: 为《人文数据分析:使用Python的案例研究》相关研究提供数据支撑
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 389.99 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。