英语名物化对标注数据库

数据集概述

该数据集是基于英国网络语料库(ukWaC)提取的3440条索引行,对英语中40个名物化词元(20个-ing形式、20个-(t)ion形式)的标注数据库。名物化按相同词根配对,用于研究英语事件性名物化的动词属性表现。

文件详解

  • 文件名称: Annotated database of nominalization pairs in English.csv
  • 文件格式: CSV
  • 字段映射:
  • nominalization_type: 名物化类型(ing/-ing形式、(t)ion/-tion形式)
  • root: 配对名物化共享的词根
  • nominalisation: 具体名物化词元
  • concordance: 名物化出现的索引行
  • sentence: 是否为完整句子(1是/0否)
  • plural: 是否为复数形式(1是/0否)
  • of-argument: 是否存在of补语(1是/0否)
  • possessive: 是否存在所有格成分(1是/0否)
  • internal_argument_compound: 是否存在复合内部论元(1是/0否)
  • accusative_internal_argument: 是否存在宾格内部论元(1是/0否)
  • clausal_complement: 是否存在从句补语(1是/0否)
  • free_relative_clause: 是否存在自由关系从句补语(1是/0否)
  • noun+ing: 是否存在带显性主语的动名词结构(1是/0否)
  • ecm: 是否存在ECM结构(1是/0否)
  • 文件名称: Description_Annotated database of nominalization pairs in English.pdf
  • 文件格式: PDF
  • 内容: 数据集构建方法、名物化配对选择标准、标注规则及研究背景说明

数据来源

英国网络语料库(ukWaC)

适用场景

  • 语言学研究: 分析英语名物化的动词属性(如格补语、复数形式)表现
  • 形态句法研究: 对比-ing与-(t)ion名物化的句法特征差异
  • 语料库语言学: 探索名物化在真实语料中的使用模式与分布规律
  • 对比语言学: 支撑英语与塞尔维亚语名物化动词属性的跨语言对比研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.98 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。