找到6个数据集

标签: 小众语言

过滤结果
  • Caucalex_Based_高加索52语言词汇数据集1_0

    2026年1月29日 30 14 7

    数据集概述 本数据集为Caucalex 1.0,包含高加索地区52种语言的词汇数据,覆盖卡尔特维利语系、纳赫-达吉斯坦语系、西北高加索语系、印欧语系和突厥语系五大语言家族,是研究高加索语言词汇特征的基础资料。 文件详解 文件名称:Caucalex 1.0.xlsx 文件格式:XLSX...
    packageimg
  • East_Caucasian_Based_东高加索村庄地理语言数据2021

    2026年1月21日 30 53 32

    数据集概述 本数据集包含东高加索地区的村庄列表,记录了村庄的坐标、使用语言及方言归属信息,方言归属基于现有文献及部分专家个人交流整理而成。数据通过单个文件呈现,为研究该地区语言地理分布提供基础信息。 文件详解 文件名称:villages_oct2021.xlsx 文件格式:XLSX...
    packageimg
  • COVID_19_Instagram_Based_五年多语言情感分析数据集

    2026年1月21日 30 131 41

    数据集概述 本数据集收录2020年1月至2024年9月间Instagram平台上500,153条COVID-19相关帖子,涵盖161种语言,包含帖子ID、描述、发布日期、语言信息及情感标签(正/负/中性),支持多语言情感分析研究,填补Instagram平台长期COVID-19讨论数据的空白。 文件详解 文件名称:Dataset.xlsx...
    packageimg
  • 尼泊尔部分语言词汇表数据集1973

    2025年12月19日 30 16 1

    数据集概述 该数据集是基于Hale 1973年《尼泊尔部分语言词汇表》衍生的CLDF格式数据集,包含尼泊尔特定语言的词汇信息,为语言研究提供结构化数据支持。 文件详解 文件名称:lexibank/halenepal-v4.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 埃米利亚语与世界语使用者语言实践比较分析研究纲要

    2025年12月16日 30 23 12

    数据集概述 该数据集是关于埃米利亚语与世界语使用者语言实践比较分析的研究纲要,聚焦语言实践的空间测量与态度观察,以压缩包形式整合相关研究资料,为语言实践比较研究提供数据支持。 文件详解 文件名称:stefanocoretta/emilian-esperanto-v1.0.zip 文件格式:ZIP(.zip) 文件内容:包含“Measuring...
    packageimg
  • 杜洪比语语音学_声母辅音丛数据集

    2025年12月5日 30 10 3

    数据集概述 该数据集呈现了杜洪比语(Duhumbi)声母辅音丛的概况及其起源,包含语言语音学描述的决策依据,补充了杜洪比语语法2.5.2节的信息,并附带若干音频文件,为研究该语言的语音结构提供支持。 文件详解 文档文件: Duhumbi Onset...
    packageimg