CLEF_2024_议会辩论_意识形态与权力识别_训练数据

数据集概述

本数据集是CLEF 2024“议会辩论意识形态与权力识别”共享任务的训练集,源自ParlaMint语料库4.0版本,包含奥地利、比利时等20余个国家及地区议会的辩论演讲文本,标注有意识形态倾向(左/右)和权力属性(执政联盟/反对党)等信息。

文件详解

  • 文件名称:trainingset-ideology-power.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含多个制表符分隔文本文件,核心字段包括:
  • id:文本唯一标识
  • speaker:发言者唯一标识
  • sex:发言者性别(可能为未指定)
  • text:议会演讲转录文本
  • text_en:自动英文翻译文本(可能为空)
  • label:二进制标注(意识形态:0=左、1=右;权力:0=执政联盟、1=反对党)

数据来源

ParlaMint语料库4.0版本

适用场景

  • 政治意识形态分类研究:基于标注数据训练模型识别议会辩论中的政治倾向(左/右)
  • 权力属性识别分析:分析执政联盟与反对党在议会辩论中的语言特征差异
  • 多语言文本分类任务:利用多国家议会数据开发跨语言政治文本分析模型
  • 议会话语研究:支持政治科学领域对议会辩论内容与政治立场关联性的实证分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 776.2 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。