数据集概述
本数据集为电子表格,记录澳大利亚联邦议会会议记录中与"非议会性"(unparliamentary)词汇共现的词群元语用学标注信息。包含词群相似度排序、标注类别、相关演讲数量及时间趋势等结构化内容,用于分析议会话语中"非议会性"词汇的使用语境与元语用特征。
文件详解
- 文件名称:similar_clusters_to_unparliamentary_annotated.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含Rank(相似度排序)、cluster_id(词群ID)、most_similar_features(共现词群)、annotation {SH}(标注笔记)、label [MH](词群标签)、category [MH](元语用类别)、category_display_order(类别展示顺序)、Category(短类别名)、Label(短标签名)、Sample Words(示例词汇)、Speeches(相关演讲数)、Trend(时间趋势可视化)、1:47(各议会届次占比)等字段。
数据来源
澳大利亚联邦议会会议记录(Hansard)
适用场景
- 政治话语元语用学研究:分析"非议会性"词汇在议会语境中的使用逻辑与语用功能。
- 议会语言规范分析:探索议会话语中"非议会性"词汇的共现模式与类别特征。
- 政治话语时间趋势研究:基于词群时间趋势数据,分析议会语言风格的演变规律。
- 语料库语言学应用:为议会话语语料库的词群标注与语义关联分析提供结构化数据支持。