找到4个数据集

分类: 公开数据 标签: 词形

过滤结果
  • Kam_kdx_Lesage非洲语言词汇表数据2019

    2026年1月31日 30 179 43

    数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
    packageimg
  • VeLeCa_Source_加泰罗尼亚语动词词形变化词库数据

    2026年1月29日 30 208 109

    数据集概述 本数据集为VeLeCa,即加泰罗尼亚语动词屈折变化词库,包含三千四百八十四个词位的十七万四千二百个词形的语音形式,以及对应的词汇、形态句法属性和频率数据。数据集总计十个文件,覆盖数据、文档、代码等类型,为加泰罗尼亚语动词的语言学研究提供结构化资源。 文件详解 数据文件(CSV格式,共5个)...
    packageimg
  • Bayesian_Phylogenetics_Based_藏_阿鲁纳恰尔地区跨喜马拉雅语言亲缘关系数据集

    2026年1月1日 30 107 67

    数据集概述 本数据集是论文“Bayesian phylogenetics illuminate shallower relationships in Trans-Himalayan languages in Tibet-Arunachal area”的存档数据,包含藏-阿鲁纳恰尔地区跨喜马拉雅语言的同源词标注信息,涉及Tshangla、Kho-...
    packageimg
  • 宾夕法尼亚德语词表_词形还原与词性标注

    2025年12月4日 30 52 16

    数据集概述 该数据集包含ENDE语料库中宾夕法尼亚德语部分的词表,涵盖1761个词元及其对应的2704个词形,已完成词形还原和词性标注,为宾夕法尼亚德语的语言分析提供基础数据。 文件详解 词表数据文件: 文件名称:ENDE-corpus POS-annotated PDC lexicon.tsv 文件格式:TSV(.tsv)...
    packageimg