-
藏缅语音和词汇CLDF数据集1991
2025年12月23日 30 115 65
数据集概述 该数据集是基于孙宏开1991年出版的《藏缅语音和词汇》构建的CLDF格式数据集,核心内容为藏缅语族语言的语音与词汇相关数据,为语言比较研究提供标准化数据支持。 文件详解 文件名称:lexibank/suntb-v4.1.zip 文件格式:ZIP压缩包(.zip)...
-
东印度尼西亚语言LexiRumah数据库v3_0_1
2025年12月22日 30 159 51
数据集概述 该数据集是东印度尼西亚语言的LexiRumah数据库,版本为v3.0.1。以压缩包形式存储,包含相关语言数据,为研究东印度尼西亚语言提供数据支持。 文件详解 文件名称:lessersunda/lexirumah-data-v3.0.1.zip 文件格式:ZIP(.zip)...
-
奥克语标注语料库
2025年12月21日 30 60 53
数据集概述 该数据集为奥克语标注语料库,包含经人工标注词性和词元的奥克语文本,共28篇文档、12425个词元,标注流程详见指定学术文章,为奥克语自然语言处理研究提供基础数据。 文件详解 文件名称: CorpusRestaureOccitan.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含采用TSV CoNLL-...
-
Lexibank透明复合词提取数据集
2025年12月21日 30 49 2
数据集概述 本数据集为研究《Extracting Transparent Compounds from Lexibank》的配套代码与数据,用于从Lexibank中提取透明复合词,支持计算机辅助语言比较领域的相关分析。 文件详解 文件名称: extracting-compounds.zip 文件格式: ZIP (.zip) 文件内容:...
-
瑞典历时词用法图数据集
2025年12月20日 30 64 18
数据集概述 本数据集包含针对瑞典语的历时词用法图(Diachronic Word Usage Graphs, WUGs),提供了瑞典语词汇使用随时间变化的结构化数据,可用于语言演变相关研究。 文件详解 文件名称: dwug_sv.zip 文件格式: ZIP压缩包 内容说明:...
-
副词作为词类及其意义_形态特征和句法作用数据集
2025年12月19日 30 73 40
数据集概述 本数据集包含一份关于副词的语言学研究文档,内容围绕副词的词类定义、语义内涵、形态特征及句法功能展开,为副词相关的语言分析提供基础资料。 文件详解 文件名称: Исламова Рухшона Абдурахим кизи.pdf 文件格式: PDF (.pdf) 文件内容:...
-
基于2015年Castro_水语方言研究_的CLDF数据集
2025年12月18日 30 135 54
数据集概述 该数据集是基于2015年Castro《水语方言研究》的CLDF格式数据集,核心内容为水语方言相关研究数据,以压缩包形式存储,未提供具体内容预览。 文件详解 文件名称: lexibank/castrosui-v3.1.zip 文件格式: ZIP压缩包 内容说明: 未提供文件内部字段或内容预览,仅包含1个压缩包文件 数据来源 Castro,...
-
乌兹别克语词汇丰富化的奥古兹方言资源
2025年12月11日 30 70 6
数据集概述 本数据集聚焦于奥古兹方言资源,旨在为乌兹别克语词汇库的丰富化提供支持。包含一份PDF格式的文档文件,内容围绕奥古兹方言相关研究展开,为语言资源建设提供基础资料。 文件详解 文件名称: Khasanov Abdumannon Majidovich.pdf 文件格式: PDF (.pdf) 文件内容:...
-
哥伦比亚原住民语言比较词汇数据集1992
2025年12月16日 30 131 1
数据集概述 该数据集基于1992年Huber与Reed的《哥伦比亚原住民语言比较词汇》研究,以CLDF格式整理了哥伦比亚原住民语言的精选词汇数据,为语言比较研究提供结构化支持。 文件详解 文件名称:lexibank/hubercolumbian-v4.0.2.zip 文件格式:ZIP压缩包...
-
NoRaRe_Based_数据整理模板标准化完整数据集
2025年12月15日 30 73 67
数据集概述 该数据集提供了用于NoRaRe数据整理的模板集合,是对原始NoRaRe仓库的镜像,当前包含少量模板,使用方法可参考相关研究文献。 文件详解 文件名称:norare-template-v0.1.zip 文件格式:ZIP(.zip) 内容说明:压缩包内包含用于NoRaRe数据整理的模板文件,具体字段及结构需解压后查看,原数据集未提供预览内容...
-
世界语言结构地图集在线数据集
2025年12月14日 30 144 106
数据集概述 该数据集为《世界语言结构地图集在线》,基于2013年出版的相关资源,通过压缩文件形式提供,可能包含世界语言结构的多维度数据,为语言结构研究提供基础资料。 文件详解 文件名称: cldf-datasets/wals-v2020.4.zip 文件格式: ZIP压缩包 内容说明:...
-
CLDF格式南钦语语言笔记数据集1988
2025年12月14日 30 62 0
数据集概述 该数据集为CLDF格式,源自1988年Helga So-Hartmann发表的《南钦语语言笔记》,收录了南钦语相关语言学研究内容,为南钦语语言特征分析提供结构化数据支持。 文件详解 文件名称:lexibank/sohartmannchin-v3.1.zip 文件格式:ZIP压缩包(.zip)...
-
柏林柯尔克孜语语言资源数据集2018
2025年12月13日 30 184 70
数据集概述 本数据集是2018年夏季学期柏林洪堡大学“城市田野调查”硕士研讨课的成果,聚焦柏林的柯尔克孜语小众语言,包含四十个斯瓦迪士核心词汇表(ASJP词汇)、两段自由叙事及一段构造句录音等语言资料,为小众语言研究提供基础数据。 文件详解 该数据集包含十二个文件,具体说明如下: - 文档类文件(PDF格式): -...
-
Alor_Pantar语言家族内部分类CLDF数据集2012
2025年12月12日 30 94 68
数据集概述 本数据集是基于Robinson和Holton 2012年发表的研究,采用计算方法对Alor-Pantar语言家族词汇进行内部分类的CLDF格式数据集,为语言家族分类研究提供标准化数据支持。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: lexibank/robinsonap-v4.1.zip - 文件格式:...
-
fauna_bororo_v0_1_Based_语言结构研究完整数据集
2025年12月12日 30 117 24
数据集概述 本数据集包含与语言结构相关的压缩文件,核心围绕LanguageStructure/fauna_bororo-v0.1.zip展开,未提供具体内容描述,文件类型单一,为压缩格式,无额外目录结构或数据划分信息。 文件详解 文件名称:LanguageStructure/fauna_bororo-v0.1.zip 文件格式:ZIP压缩包(.zip)...
-
杜洪比宗教文本与歌曲转录解析数据集
2025年12月10日 30 2 0
数据集概述 本数据集包含杜洪比语的宗教文本与歌曲相关数据,涵盖录音文件、转录文件、解析文件及翻译文件等多种格式,对应佛教训诫、苯教预言文本和即兴歌曲三类内容,为杜洪比语研究提供多维度资源。 文件详解 数据集包含多种格式的文件,具体说明如下: -...
-
语言数据资源链接数据库
2025年12月10日 30 190 52
数据集概述 该数据集是一个链接资源数据库,汇集了多个语言学数据库与数据集的访问链接,旨在帮助用户查找符合研究需求的免费语言类网络数据资源。此为最终版本,将不再维护或更新。 文件详解 文件名称:linguistic-data-master.zip 文件格式:ZIP(.zip)...
-
电子版世界英语变体地图集数据集2020
2025年12月10日 30 130 92
数据集概述 该数据集是电子版世界英语变体地图集(EWAVE)的CLDF格式压缩包,包含与英语变体相关的语言资源,可能涉及语音数据(WAV格式音频),为研究全球英语变体提供标准化数据支持。 文件详解 文件名称: cldf-datasets/ewave-v3.0.zip 文件格式: ZIP压缩包 文件内容: 压缩包可能包含遵循CLDF(Cross-...
-
Max_Planck_PHOIBLE2_0_1CLDF_Based_跨语言语音数据结构化完整数据集
2025年12月9日 30 79 41
数据集概述 该数据集是将PHOIBLE 2.0.1数据转换为CLDF(Cross-Linguistic Data Formats)结构数据集的存档文件,便于跨语言数据的标准化存储与分析,为语言研究提供结构化数据支持。 文件详解 文件名称: cldf-datasets/phoible-v2.0.1.zip 文件格式: ZIP (.zip) 内容说明:...
-
陈其光苗瑶语言CLDF数据集2012
2025年12月9日 30 155 111
数据集概述 该数据集是基于陈其光2012年出版的《苗瑶语文》构建的CLDF格式数据集,包含苗瑶语言相关的标准化语言学数据,为语言研究提供结构化数据支持。 文件详解 压缩文件: lexibank/chenhmongmien-v3.1.zip:ZIP格式压缩文件,包含基于《苗瑶语文》构建的CLDF数据集内容,具体字段需解压后查看。 数据来源...



