基尔南亚语言类型学数据库

数据集概述

该数据库包含南亚地区42种语言(涵盖印欧、达罗毗荼等语系及孤立语言)的语言类型学特征数据,涉及语法、否定策略等230个特征,部分特征源自Grambank数据库,为语言学研究提供基础数据支持。

文件详解

  • 文件名称: Kiel_Corpus_data.csv
  • 文件格式: CSV
  • 字段映射: 包含语言标识(glottocode、name)、语系(family)及各语言类型学特征(如GB024、GB025等)的编码值(1/0/?/NA)
  • 文件名称: Kiel_Corpus_features.csv
  • 文件格式: CSV
  • 字段映射: 包含特征标识(feature)、描述(description)、类型(type)及所属语法领域(如ergativity、negation等)
  • 文件名称: Kiel_Corpus_bibliography.pdf
  • 文件格式: PDF
  • 内容说明: 数据库相关参考文献文档

适用场景

  • 历史语言学研究: 分析南亚语言类型学特征的演化与亲缘关系
  • 语法理论验证: 基于多语言特征数据检验语言学理论假设
  • 语言接触研究: 探究不同语系语言在语法特征上的相互影响
  • 计算语言学应用: 为语言类型学特征预测模型提供训练数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.08 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。