-
Pere_Based科特迪瓦濒危语言动植物词汇表完整数据
2026年1月30日 30 103 50
数据集概述 本数据集为科特迪瓦Pere(又称Bere、Mbre)语言的动植物词汇表。Pere是科特迪瓦中部的严重濒危语言,在Glottolog中以代码mbre1244、ISO 639-3中以代码mka收录。数据集包含一份Excel文件,记录该语言中动植物相关术语,为濒危语言保护和词汇研究提供基础资源。 文件详解 文件名称:Pɛrɛ flora...
-
Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据
2026年1月30日 30 94 73
数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
-
CLDF_NorthPeruLex_秘鲁北部小语种词汇数据集
2026年1月29日 30 1 0
数据集概述 本数据集为基于CLDF格式的词汇数据集,源自Ugarte等人即将发布的"NorthPeruLex"项目,收录秘鲁北部小语种家族及孤立语言的词汇信息,为该区域语言研究提供结构化数据支持。 文件详解 主文件包 文件名称:lexibank/northperulex-v0.2.zip 文件格式:ZIP...
-
Pere_Lexicon_Based科特迪瓦濒危语言词汇表数据
2026年1月28日 30 132 103
数据集概述 本数据集为科特迪瓦Pere语(文献中亦称Pɛrɛ、Bere、Mbre)的词汇表,Pere语是科特迪瓦中部的严重濒危语言,在Glottolog中以"Mbre"收录(代码mbre1244),ISO 639-3代码为mka。数据集包含一份词汇表文件,可用于濒危语言保护与语言学研究。 文件详解 文件名称:Pere lexicon.xlsx...
-
SAILS_2014_Based_南美原住民语言结构在线数据_存档
2026年1月27日 30 117 114
数据集概述 本数据集为2014年发布的“南美原住民语言结构(SAILS)在线”项目数据,包含南美原住民语言的结构信息,由马克斯·普朗克进化人类学研究所发布,以压缩包形式提供,仅含一个文件。 文件详解 文件名称:sails-v2014.zip 文件格式:ZIP(压缩包)...
-
CLDF_Dataset_Kusunda语言250个概念词表数据2020
2026年1月22日 30 68 23
数据集概述 本数据集为CLDF格式,源自Aaley和Bodt于2020年发布的《New Kusunda data: A list of 250 concepts》,包含Kusunda语言的250个概念词表信息,是语言比较研究的标准化数据资源,仅含一个压缩文件。 文件详解 文件名称:lexibank/aaleykusunda-v2.1.zip...
-
Deepadung_Based_Palaung方言词汇比较数据集v1_3
2026年1月22日 30 172 110
数据集概述 本数据集源自Deepadung等人2015年发表的《中缅泰Palaung方言词汇比较》研究,以CLDF格式整理了Palaung方言的词汇对比数据,包含中国、缅甸、泰国三地Palaung方言的词汇信息,为语言多样性研究提供结构化资源。 文件详解 压缩包文件 文件名称:lexibank/deepadungpalaung-v1.3.zip...
-
Ume_Saami_Dictionary_Comparison_Data
2026年1月22日 30 2 1
数据集概述 本数据集为书评《A new general dictionary of Ume Saami》的配套表格,展示Schlachter 1958年与Barruk 2018年版Ume萨米语词典的差异。数据对齐两版词典中以v开头的词条,呈现词汇的共性与差异,支持语言词汇演变研究。 文件详解 文件名称:ume-MalaLpW-Barruk-...
-
Mondzish_Based_中国采集词汇录音转录数据库_2012_2015
2026年1月20日 30 61 37
数据集概述 本数据集为Mondzish(Mangish)词汇数据库,包含2012-2015年在中国采集的音频录音转录内容,是单一文件的词汇资源,可用于Mondzish语言的词汇研究与分析。 文件详解 文件名称:Mondzish_lexical_database.xlsx 文件格式:XLSX...
-
帕拉普兰库尼亚特贾语_基于皮詹塔贾拉语和扬库尼亚特贾语的方言_动词词库数据集
2026年1月20日 30 49 47
数据集概述 本数据集为Pitjantjatjara/Yankunytjatjara语言的动词词库,包含动词形态、语音、词素等结构化信息,由墨尔本大学Sasha Wilmoth创建。数据涵盖动词形式表、语音表、词素表等11个文件,支持对该澳大利亚原住民语言动词系统的深入分析。 文件详解 数据文件(CSV格式,共7个)...
-
dictionaria_Based_所罗门群岛Teanu语言词典数据_v1_0
2026年1月20日 30 175 111
数据集概述 本数据集为2021年发布的所罗门群岛Teanu语言词典,由Alexandre François编纂,属于Dictionaria系列第15卷,内容包含1-1877页的词典条目,是研究Teanu语言的重要资源。 文件详解 文件名称:dictionaria/teanu-v1.0.zip 文件格式:ZIP...
-
Raja_Ampat_South_Halmahera_拉贾安帕特14种南岛语变体词汇比较数据
2026年1月17日 30 124 96
数据集概述 本数据集为Excel表格,包含新几内亚西北部拉贾安帕特群岛14种近缘南岛语变体的词汇比较数据,涉及354个概念下的489组比较项,记录语音、声调、重音等信息,支持南岛语族语言的历史语言学分析。 文件详解 文件名称:RA-TonalCorrespondences-vFinal.xlsx 文件格式:XLSX 字段映射介绍:含3个工作表...
-
库巴_列兹金语城市田野调查数据集2019
2025年12月23日 30 74 20
数据集概述 该数据集是2019至2020年冬季学期科隆大学语言学研究所“城市田野调查”课程的实践成果,包含与阿塞拜疆列兹金语母语者合作采集的库巴-列兹金语资料,涵盖基础词汇、传统儿歌、民谣及相关元数据与项目文档。 文件详解 数据集包含四类核心内容文件,具体说明如下: - 斯瓦迪士核心词表文件(40词节选): - William-...
-
东印度尼西亚语言LexiRumah数据库v3_0_1
2025年12月22日 30 189 168
数据集概述 该数据集是东印度尼西亚语言的LexiRumah数据库,版本为v3.0.1。以压缩包形式存储,包含相关语言数据,为研究东印度尼西亚语言提供数据支持。 文件详解 文件名称:lessersunda/lexirumah-data-v3.0.1.zip 文件格式:ZIP(.zip)...
-
Lower_Fungom_Ngun_Based_喀麦隆Ngun语言词汇资源数据集
2025年12月22日 30 140 5
数据集概述 该数据集为Ngun语言的225词表,Ngun是蒙巴姆语的一种变体,属于也门-金比语族,使用于喀麦隆西北部Menchum省Fungom分区的Lower Fungom地区,语言具有声调及名词前缀特征,记录了两位顾问间的词汇变异。 文件详解 文件名称:...
-
奥克语标注语料库
2025年12月21日 30 185 123
数据集概述 该数据集为奥克语标注语料库,包含经人工标注词性和词元的奥克语文本,共28篇文档、12425个词元,标注流程详见指定学术文章,为奥克语自然语言处理研究提供基础数据。 文件详解 文件名称: CorpusRestaureOccitan.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含采用TSV CoNLL-...
-
基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017
2025年12月21日 30 43 5
数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
-
皮卡德语标注语料库
2025年12月20日 30 102 23
数据集概述 该数据集包含25篇皮卡德语文本,经人工标注词性、词元、法语翻译及地点实体,由法国ANR资助的RESTAURE项目产出,标注流程详见指定学术文章。 文件详解 文件名称: corpus_picard_restaure.zip(压缩包) 文件格式: ZIP 包含内容: "extraits_reference_bruts"文件夹(若有):...
-
喀麦隆Lower_Fungom地区Mufu语言225词词汇表
2025年12月20日 30 24 20
数据集概述 该数据集为喀麦隆Lower Fungom地区Mufu语言的225词词汇表。Mufu属于Yemne-Kimbi语族,是一种声调语言,其名词前缀已演变为定语环境下的一致标记。数据收集自两位顾问,存在个体词汇差异,可能与社会语言学背景相关。 文件详解...
-
下丰贡地区阿朱姆布语暂定名词类数据集
2025年12月20日 30 98 39
数据集概述 本数据集聚焦喀麦隆西北部下丰贡地区阿朱姆布语的暂定名词类研究,记录其名词类前缀、一致关系及声调模式,因独特一致系统暂将5/6类与9/10类合并,为后续分类研究提供基础。 文件详解 文件名称:KPAAMCAM_NTs_AJUMBU TENTATIVE NOUNS CLASSES_28Nov2018.pdf 文件格式:PDF...



