斯洛文尼亚语含次级未完成体语素调整的Lec型名物化数据集

数据集概述

该数据集基于Arsenijević等人2024年的数据集衍生,核心记录斯洛文尼亚语中Lec型名物化(原数据集标注为lc-)的次级未完成体语素调整现象,包含调整后语素的名物化形式及其在国家语料库Gigafida 2.0中的出现频率。

文件详解

  • 说明文档:Instructions for_Lec-nominalizations with an adjusted secondary imperfective morpheme in Slovenian.pdf,PDF格式,提供数据集的背景、收集方法及使用说明。
  • 数据文件:Lec-nominalizations with adjustment.csv,CSV格式,字段包括ID、动词词典形式、标注类型、原lc型名物化、调整型名物化(1-2项)及对应频率数据。

数据来源

衍生自Arsenijević, B.等人2024年的Western South Slavic Verb HyperVerb数据库,原始数据来源于Zenodo

适用场景

  • 斯拉夫语言学研究:分析斯洛文尼亚语动词名物化过程中的语素调整规律
  • 语料库语言学分析:研究次级未完成体语素在名物化中的变体分布与使用频率
  • 形态学理论验证:验证语素变体(如-ov-/-ev-)在名物化中的方向性调整假设
  • 计算语言学应用:为名物化自动识别与生成模型提供标注数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.42 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。