德国政治演讲语料库

数据集概述

该数据集是一个文本档案库,聚焦于1990年以来德国高层官员的政治演讲,按政治相关性筛选。数据包含带有元数据的XML格式文本文件,是自然语言处理和语料库语言学研究的资源。

文件详解

  • 文件名称: German-political-speeches-2019-release.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 压缩包内包含以XML格式编码的文本文件,每个文件记录了德国政治演讲的文本内容及其相关元数据。具体字段映射需解压后查看XML文件结构。

数据来源

  • 德国总统府、总理府、联邦议院、外交部官方页面
  • 赫尔穆特·科尔档案馆、沃尔夫冈·蒂尔泽和诺伯特·拉默特的个人页面

适用场景

  • 德国政治话语分析: 研究1990年后德国政治演讲中的议题、立场和语言风格演变
  • 自然语言处理研究: 用于德语文本分类、情感分析、主题建模等NLP任务的训练数据
  • 语料库语言学研究: 分析政治文本中的语言特征、修辞手法和词汇使用模式
  • 政治传播学研究: 探索德国高层官员的政治沟通策略和公众话语构建方式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 26.79 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。