数据集概述
本数据集是基于Heath等人2016年的《Dogon Comparative Wordlist》衍生的CLDF格式数据集,由Moran、Forkel和Heath编辑,记录Dogon语言的比较词表信息,为语言学研究提供结构化数据支持。
文件详解
- 文件名称:heathdogon-v0.3.zip
- 文件格式:ZIP
- 字段映射介绍:数据集为CLDF格式归档文件,包含与Dogon语言比较词表相关的结构化数据,具体字段需解压后查看,原数据未提供详细字段映射。
数据来源
Moran, Steven & Forkel, Robert & Heath, Jeffrey (eds.) 2016. Dogon and Bangime Linguistics. Jena: Max Planck Institute for the Science of Human History.(在线地址:http://dogonlanguages.info,访问时间2024-08-12)
适用场景
- 历史语言学研究:分析Dogon语言的词汇演变、亲缘关系及语言历史。
- 语言比较分析:对比Dogon语言与其他语言的词汇特征,探究语言接触与分化。
- 计算语言学应用:作为NLP模型训练数据,支持语言识别、词汇对齐等任务。
- 语言资源建设:补充Dogon语言的结构化词表资源,服务语言保护与研究。