塞尔维亚议会辩论语料库1997_2020

数据集概述

该数据集包含塞尔维亚国民议会1997-2020年(八个任期)的议会辩论语料库,涵盖超三十万篇演讲,经清洗预处理,并附当选代表及其政党的元数据,为研究塞尔维亚议会政治提供结构化文本与属性数据支持。

文件详解

  • 议会辩论数据文件(RDS格式):共8个文件,如SRB_04_term_final.RDS、SRB_05_term_final.RDS等,对应不同议会任期的辩论数据,存储为R语言数据文件格式,包含各任期演讲文本及相关属性
  • 政党元数据文件:
  • 文件名称:Serbia_parties_final.xlsx
  • 文件格式:Excel
  • 内容:包含塞尔维亚议会政党的元数据信息
  • 议员元数据文件:
  • 文件名称:Serbia_MPs_final.xlsx
  • 文件格式:Excel
  • 内容:包含塞尔维亚议员的元数据信息
  • 代码本文件(PDF格式):共3个文件,CODEBOOK_SRB_corpus.pdf、CODEBOOK_SRB_mps.pdf、CODEBOOK_SRB_parties.pdf,分别对应语料库、议员、政党数据的字段说明与编码规则

数据来源

Zenodo(基于输入中的迁移信息及引用链接)

适用场景

  • 政治学研究:分析塞尔维亚议会不同时期的政治话语、议题分布及政党立场演变
  • 计算语言学应用:用于训练与评估议会文本分类、政策议题识别等自然语言处理模型
  • 比较政治分析:结合克罗地亚、波黑等其他巴尔干国家议会数据,开展区域政治话语比较研究
  • 政治行为研究:探究议员个体或政党在议会辩论中的发言模式与政策偏好关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 299.84 MiB
最后更新 2025年12月25日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。