数据集概述
该数据集是基于英国网络语料库(ukWaC)提取的3440条索引行,对英语中40个名物化词元(20个-ing形式、20个-(t)ion形式)的标注数据库。名物化按相同词根配对,用于研究英语事件性名物化的动词属性表现。
文件详解
- 文件名称: Annotated database of nominalization pairs in English.csv
- 文件格式: CSV
- 字段映射:
- nominalization_type: 名物化类型(ing/-ing形式、(t)ion/-tion形式)
- root: 配对名物化共享的词根
- nominalisation: 具体名物化词元
- concordance: 名物化出现的索引行
- sentence: 是否为完整句子(1是/0否)
- plural: 是否为复数形式(1是/0否)
- of-argument: 是否存在of补语(1是/0否)
- possessive: 是否存在所有格成分(1是/0否)
- internal_argument_compound: 是否存在复合内部论元(1是/0否)
- accusative_internal_argument: 是否存在宾格内部论元(1是/0否)
- clausal_complement: 是否存在从句补语(1是/0否)
- free_relative_clause: 是否存在自由关系从句补语(1是/0否)
- noun+ing: 是否存在带显性主语的动名词结构(1是/0否)
- ecm: 是否存在ECM结构(1是/0否)
- 文件名称: Description_Annotated database of nominalization pairs in English.pdf
- 文件格式: PDF
- 内容: 数据集构建方法、名物化配对选择标准、标注规则及研究背景说明
数据来源
英国网络语料库(ukWaC)
适用场景
- 语言学研究: 分析英语名物化的动词属性(如格补语、复数形式)表现
- 形态句法研究: 对比-ing与-(t)ion名物化的句法特征差异
- 语料库语言学: 探索名物化在真实语料中的使用模式与分布规律
- 对比语言学: 支撑英语与塞尔维亚语名物化动词属性的跨语言对比研究