找到3个数据集

标签: 词汇结构

过滤结果
  • 图皮语词汇数据库

    2025年12月8日 30 146 68

    数据集概述 该数据集为图皮语词汇数据库(TuLeD),包含图皮语系语言的词汇资源,以压缩文件形式存储,未划分训练测试、数据标签或原始处理数据,为语言研究提供基础词汇数据支持。 文件详解 文件名称:tupian-language-resources/tuled-v0.12.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 哥廷根印度语言电子文本注册处词典学数据集

    2025年12月6日 30 84 38

    数据集概述 该数据集是哥廷根印度语言电子文本注册处(GRETIL)下的词典学相关数据,主要包含四个HTML格式的文件,未区分训练/测试集、数据/标签集或原始/处理数据,文件类型单一。 文件详解 数据集包含4个HTML格式文件,具体如下: 文件名称:amark2_u.htm、amark3_u.htm、amark1pu.htm、amark1hu.htm...
    packageimg
  • 基于Sagart等人2019年汉藏语词汇同源词数据库的CLDF数据集

    2025年12月4日 30 151 50

    数据集概述 该数据集是基于Sagart等人2019年发布的"汉藏语词汇同源词数据库"转换而来的CLDF格式数据集,主要用于汉藏语系语言的词汇同源关系研究,为语言比较和历史语言学分析提供结构化数据支持。 文件详解 文件名称: lexibank/sagartst-v2.1.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg