找到85个数据集

标签: 比较语言学

过滤结果
  • 数字化语言学词形变化标注框架研究数据_2020

    2026年2月1日 30 184 113

    数据集概述 本数据集是研究“Developing an annotation framework for word formation processes in comparative linguistics”的配套数据与代码,包含一个压缩文件,用于支持比较语言学领域词形变化过程标注框架的开发与应用,为相关语言学研究提供结构化的数据资源。 文件详解...
    packageimg
  • Dryad_栗冠弯嘴鹛非人类发声系统音位对比实验数据

    2026年1月31日 30 115 23

    数据集概述 本数据集为栗冠弯嘴鹛(Pomatostomus ruficeps)非人类发声系统音位对比实验数据,包含该鸟类通过重组无意义声学元素(A和B)形成不同排列(AB或BAB)以产生功能差异叫声的实验证据,支持对人类语言前声音重组能力的研究。 文件详解 文件名称:Engesser et al. Dryad.xlsx 文件格式:XLSX...
    packageimg
  • Kam_kdx_Lesage非洲语言词汇表数据2019

    2026年1月31日 30 156 143

    数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
    packageimg
  • CLDF_NorthPeruLex_秘鲁北部小语种词汇数据集

    2026年1月29日 30 65 47

    数据集概述 本数据集为基于CLDF格式的词汇数据集,源自Ugarte等人即将发布的"NorthPeruLex"项目,收录秘鲁北部小语种家族及孤立语言的词汇信息,为该区域语言研究提供结构化数据支持。 文件详解 主文件包 文件名称:lexibank/northperulex-v0.2.zip 文件格式:ZIP...
    packageimg
  • Chacon_2022_西北阿拉瓦克语族注释斯瓦迪士词表数据集

    2026年1月29日 30 187 39

    数据集概述 本数据集为Chacon于2022年发布的西北阿拉瓦克语族注释斯瓦迪士词表CLDF数据集,包含1个压缩文件,存储于单一目录下,无训练测试或原始处理数据拆分,主要用于语言进化与比较语言学研究。 文件详解 压缩文件 文件名称:lexibank/chaconnorthwestarawakan-v1.0.zip 文件格式:ZIP...
    packageimg
  • Pere_Lexicon_Based科特迪瓦濒危语言词汇表数据

    2026年1月28日 30 192 174

    数据集概述 本数据集为科特迪瓦Pere语(文献中亦称Pɛrɛ、Bere、Mbre)的词汇表,Pere语是科特迪瓦中部的严重濒危语言,在Glottolog中以"Mbre"收录(代码mbre1244),ISO 639-3代码为mka。数据集包含一份词汇表文件,可用于濒危语言保护与语言学研究。 文件详解 文件名称:Pere lexicon.xlsx...
    packageimg
  • CLDF_Based_Proto_Purus原始语语音重建数据集2021

    2026年1月22日 30 186 27

    数据集概述 本数据集是基于de Carvalho 2021年发表的《Proto-Purus(阿拉瓦克语系)音段音系比较重建》研究生成的CLDF格式数据集,包含Proto-Purus原始语的语音重建相关数据,为语言学领域的原始语重建研究提供结构化参考。 文件详解 文件名称:lexibank/carvalhopurus-v1.1.zip 文件格式:ZIP...
    packageimg
  • Ume_Saami_Dictionary_Comparison_Data

    2026年1月22日 30 170 56

    数据集概述 本数据集为书评《A new general dictionary of Ume Saami》的配套表格,展示Schlachter 1958年与Barruk 2018年版Ume萨米语词典的差异。数据对齐两版词典中以v开头的词条,呈现词汇的共性与差异,支持语言词汇演变研究。 文件详解 文件名称:ume-MalaLpW-Barruk-...
    packageimg
  • Proto_Uralic_Based_乌拉尔语同源词分布附录数据_2022

    2026年1月21日 30 120 90

    数据集概述 本数据集为论文《Drastic demographic events triggered the Uralic spread》的附录,包含精选的原始乌拉尔语(Proto-Uralic)同源词及其分布信息,用于支撑乌拉尔语系扩散相关的研究分析,共包含1个文件。 文件详解 文件名称:PU_cognates.xlsx 文件格式:XLSX...
    packageimg
  • Mouton_Atlas_Based_语言与文化地图集基础数据集_2019版

    2026年1月20日 30 182 26

    数据集概述 本数据集为《Mouton语言与文化地图集》(2019年版)的基础数据,用于生成地图、图表及书中结果。数据提取自历时比较语言学问卷数据库,包含四份附录文件,支持语言文化相关的可视化与分析应用。 文件详解 附录文件(共4份)...
    packageimg
  • CLDF_Based_1853年Mentawei群岛数字词汇比较数据集_2_0_0版

    2026年1月18日 30 201 158

    数据集概述 本数据集基于Carl Benjamin Hermann von Rosenberg1853年发表的《De Mentawei-Eilanden en Hunne Bewoners》文献,提取并整理为CLDF格式的比较数字词汇数据,用于研究Mentawei群岛语言中的数字系统特征,当前为2.0.0版本,包含1个压缩文件。 文件详解...
    packageimg
  • Multi_CAST_Based_Kalamang语言口语文本标注语料库数据_v2311

    2026年1月13日 30 127 72

    数据集概述 本数据集为Multi-CAST多语言口语文本标注语料库的一部分,包含Kalamang语言的标注口语文本数据。数据集由Eline Visser于2023年贡献,属于Multi-CAST语料库的2311版本,旨在为语言学研究提供标准化的多语言口语资源。 文件详解 文件名称:Multi-CAST/mckalamang-v2311.zip...
    packageimg
  • 瓦克纳格尔定律研究论文

    2025年12月26日 30 28 21

    数据集概述 本数据集为一篇研究瓦克纳格尔定律的论文,探讨不同语言中附着词排序的句法分析方法,比较扎利兹尼亚克与其他学者模型的差异,涉及古俄语、保加利亚语等语言的附着词簇分析,为句法理论研究提供参考。 文件详解 文件名称: Go to Wackernagel.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 乌兹别克语构词方法研究文档

    2025年12月19日 30 151 116

    数据集概述 本数据集为一份研究文档,探讨乌兹别克语中的构词方法,涵盖词缀法、重复法、语义构词法、合成法、缩写法及语音构词法,通过举例说明各方法对丰富语言的作用,并提及语言学家对构词过程语言学意义的观点。 文件详解 文件名称: 73.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 翻译规范的本质

    2025年12月23日 30 13 3

    数据集概述 本数据集围绕翻译规范的本质展开,包含一份PDF格式的文档,为研究翻译规范相关主题提供基础资料。 文件详解 文件名称: Kasimova Nafisa Farkhadovna.pdf 文件格式: PDF (.pdf) 内容说明: 该文档属于翻译规范主题的研究文献,具体内容需通过文档内容查看,未提供详细字段信息。 适用场景 翻译学研究:...
    packageimg
  • 俄语功能与风格分化研究

    2025年12月23日 30 10 1

    数据集概述 该数据集围绕俄语的功能与风格分化主题展开,包含一篇相关研究的PDF文档,为研究俄语语言结构、功能分类及风格特征提供文献资料支持。 文件详解 文件名称: Alimardanova Shaxlo Ashurmamatovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • 乌兹别克语中动作_状态类_形象化_词汇研究_托加伊_穆罗达作品案例

    2025年12月23日 30 209 185

    数据集概述 该数据集聚焦乌兹别克语中的动作-状态类(形象化)词汇研究,以托加伊·穆罗达的作品为案例展开分析,包含一篇相关研究的PDF文档,为乌兹别克语词汇语义研究提供资料支持。 文件详解 文件名称: Nuraliyev G‘olibjon Qurbonboyevich.pdf 文件格式: PDF (.pdf) 文件内容: 围绕乌兹别克语中动作-...
    packageimg
  • 杜洪比语引出笔记数据集

    2025年12月22日 30 164 75

    数据集概述 本数据集包含《杜洪比语语法》(Brill,2019)相关的引出笔记PDF文件,配有原始音频文件(DOI 10.5281/zenodo.1406852)。引出会话主要使用仓洛语和杜洪比语,笔记中的分析内容与最终语法描述可能存在差异。 文件详解...
    packageimg
  • 现代标准斯拉夫语支平行文本数据集

    2025年12月22日 30 155 81

    数据集概述 本数据集包含克罗地亚语、斯洛伐克语、斯洛文尼亚语三种现代标准斯拉夫语支的平行文本,以《约翰福音》为内容,通过平行文本设计抵消体裁影响,为语言比较研究提供基础数据。 文件详解 文件名称:Gospel.Croatian.txt;格式:TXT;内容:克罗地亚语版《约翰福音》文本,基于伊万·沙里奇的新约译本...
    packageimg
  • 南岛语系语言关系模型支持数据集

    2025年12月22日 30 154 117

    数据集概述 本数据集是Smith《晚期马来-波利尼西亚语:南岛语系语言关系新模型》一文的配套表格数据,用于支持文章中的分析。原计划作为附录置于文末,为提升文章可读性移至此处。 文件详解 文件名称: LMP.appendices.pdf 文件格式: PDF (.pdf) 内容描述: 包含原计划作为文章附录的表格数据及相关说明 文件名称:...
    packageimg