Linguistic_Criteria_Based_11种语言词类区分与重叠的语言标准数据

数据集概述

本数据集包含11种语言中名词、动词、形容词和副词的词类区分及重叠案例的语言标准信息,涵盖音系、形态、句法、语义等标准类型,用于支撑《词类描述类型学》硕士论文研究,共3个文件。

文件详解

  • Linguistic_Criteria_Final_excel.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含glottocode(语言代码)、language_name(语言名称)、wordclass(es)(词类)、relation(关系)、criteria_type(标准类型)、criteria_description(标准描述)、uncertainty_type(不确定类型)、uncertainty_description(不确定描述)等字段
  • Linguistic_Criteria_Final_csv.csv
  • 文件格式:CSV
  • 字段映射介绍:与XLSX文件字段一致,包含语言代码、名称、词类、关系、标准类型及描述、不确定类型及描述等信息
  • Linguistic_Criteria_Final_csv_utf-8.csv
  • 文件格式:CSV(UTF-8编码)
  • 字段映射介绍:与上述CSV文件内容一致,采用UTF-8编码优化字符显示

数据来源

阿姆斯特丹大学硕士论文库,论文标题“A typology of word class descriptions”

适用场景

  • 语言类型学研究:分析不同语言词类区分的共性与差异,构建词类描述的类型学框架
  • 词类标准对比分析:对比11种语言中音系、形态、句法、语义等标准在词类区分中的应用
  • 语言数据标准化:为多语言词类标注提供统一的标准参考
  • 语言学教学参考:作为语言学课程中词类理论与跨语言案例教学的辅助材料
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.09 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。