形态句法区分的不确定性与变异性测量评估补充材料

数据集概述

本数据集是《语言类型学》期刊相关论文的补充材料,围绕形态句法区分的三个核心问题(边界强度、构成、架构),提供研究使用的原始数据及统计分析(相关矩阵、随机森林、聚类验证)的代码与结果文档,支撑方法论问题的探讨。

文件详解

  • SM1_Database.csv:CSV格式数据文件,包含核心研究数据,字段示例:Language(语言)、Glottocode(语言代码)、Family(语系)、Morphs(形态单位)等
  • SM2_CorrelationMatrices.Rmd:R Markdown格式代码文件,用于生成相关矩阵
  • SM2_CorrelationMatrices.pdf:PDF格式文档,为相关矩阵分析结果
  • SM3_RandomForest.Rmd:R Markdown格式代码文件,用于随机森林分析
  • SM3_RandomForest.pdf:PDF格式文档,为随机森林分析结果
  • SM4_ClusterValidation.Rmd:R Markdown格式代码文件,用于聚类与聚类验证分析
  • SM4_ClusterValidation.pdf:PDF格式文档,为聚类验证分析结果

适用场景

  • 语言类型学研究:分析不同语言形态与句法系统的区分度及变异性
  • 语言学方法论探讨:研究形态句法区分相关统计分析方法的应用局限
  • 计算语言学分析:验证相关矩阵、随机森林、聚类等统计方法在语言数据中的适用性
  • 语言架构比较:探究不同语言形态句法系统的划分模式差异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.46 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。