历史期刊_Francia_1973_2022年主题建模数据集

数据集概述

本数据集为《Francia》期刊1973-2022年主题建模研究的补充资料,包含数据报告、作者性别映射、多语言语料元数据、Mallet主题建模结果、文档-主题相关性及可视化文件,支撑该期刊研究趋势与内容的分析。

文件详解

  • 数据报告文件:
  • 00_koenig_loehden_francia_datenreport_v1.pdf:PDF格式,含研究方法、结果的补充说明与统计,为相关发表文章提供背景支撑
  • 作者信息文件:
  • 01_authors_francia.csv:CSV格式,包含authorID、author、gender字段,记录作者性别映射
  • 语料元数据文件:
  • 02a_francia_dt_metadaten_epoche_rubrik.xlsx:Excel格式,德语语料中文章的时代与栏目映射
  • 02b_francia_fr_metadaten_epoche_rubrik.xlsx:Excel格式,法语语料中文章的时代与栏目映射
  • 02c_francia_eng_metadaten_epoche_rubrik.xlsx:Excel格式,英语语料中文章的时代与栏目映射
  • 主题建模结果文件:
  • 03a_francia_topic_model_30_dt_korpus.xlsx:Excel格式,德语语料Mallet主题建模结果,含主题、年度占比、文章占比及主题树状图
  • 03b_francia_topic_model_30_frz_korpus.xlsx:Excel格式,法语语料Mallet主题建模结果,含主题、年度占比、文章占比及主题树状图
  • 04a系列文件(如04a_francia_dt.txt、04a_francia.comp_dt.txt等):TXT、XML格式,德语语料Mallet原始输出文件
  • 04b系列文件(如04b_francia_fr.txt、04b_francia.comp_fr.txt等):TXT、XML格式,法语语料Mallet原始输出文件
  • 文档-主题相关性文件:
  • 05a_francia_document_topic_correlation_dt_korpus.xlsx:Excel格式,德语语料文档与主题的相关性数据
  • 05b_francia_document_topic_correlation_fr_korpus.xlsx:Excel格式,法语语料文档与主题的相关性数据
  • 辅助文件:
  • 06_stopwords_francia.txt:TXT格式,研究中使用的停用词表
  • PNG格式文件:共94个,含24个德语主题、23个法语主题的词云与趋势曲线可视化

适用场景

  • 历史学期刊研究:分析《Francia》期刊1973-2022年的研究热点与趋势演变
  • 主题建模方法应用:验证Mallet工具在多语言历史文献主题分析中的效果
  • 学术出版性别研究:基于作者性别数据探究历史学期刊的作者性别分布特征
  • 数字人文可视化:利用词云、趋势曲线等可视化文件展示期刊主题的动态变化
  • 历史研究领域划分:通过文章时代与栏目映射,识别不同历史时期的研究重点
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 47.82 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。