-
CLDF_Based_南美低地语言比较词表数据集2024
2026年1月30日 30 153 44
数据集概述 本数据集为CLDF格式,源自Blum等人2024年的研究,包含用于探究南美低地语言间远亲关系的比较词表。数据以压缩包形式存储,可支持语言亲缘关系分析、词汇比较研究等应用。 文件详解 压缩包文件 文件名称:pano-tacanan-history/blumpanotacana-v1.2.zip 文件格式:ZIP...
-
Social_Media_Based语言竞争演化数学描述数据
2026年1月29日 30 192 179
数据集概述 本数据集围绕社交媒体对语言分化的影响展开,基于描述两种语言竞争的数学模型,分析社交网络连接度对语言演化的作用。研究发现高连接度未使系统同质化,反而在特定参数下促进语言分化,为理解语言竞争与演化提供量化依据。 文件详解 压缩文件 文件名称:code.zip 文件格式:ZIP...
-
Mienic_lexical_isogloss_database
2026年1月28日 30 16 13
数据集概述 本数据集为Mienic语言词汇同言线数据库,包含已识别或潜在的Mienic语言变体词汇同言线相关信息,以单个Excel文件形式呈现,无目录结构和文件拆分,可用于语言变体的词汇特征分布研究。 文件详解 文件名称:Mienic_lexical_isogloss_database.xlsx 文件格式:XLSX...
-
SAILS_2014_Based_南美原住民语言结构在线数据_存档
2026年1月27日 30 30 9
数据集概述 本数据集为2014年发布的“南美原住民语言结构(SAILS)在线”项目数据,包含南美原住民语言的结构信息,由马克斯·普朗克进化人类学研究所发布,以压缩包形式提供,仅含一个文件。 文件详解 文件名称:sails-v2014.zip 文件格式:ZIP(压缩包)...
-
BDPROTO_Source_古代与重构语言音系数据库_1_1版本
2026年1月27日 30 50 47
数据集概述 本数据集为BDPROTO 1.1版本,是古代与重构语言音系数据库,包含更多语言的音系清单及基础描述性统计,共2个归档文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据。 文件详解 归档文件 文件名称:bdproto-1.1.zip 文件格式:ZIP 内容说明:BDPROTO...
-
Grollemund_Bantu_班图语扩张栖息地影响人类迁徙研究数据2015
2026年1月20日 30 44 36
数据集概述 本数据集基于Grollemund等人2015年的研究,聚焦班图语扩张过程中栖息地对人类迁徙路线和速度的影响。数据以CLDF格式组织,包含相关语言演化与人类迁徙的关联信息,为研究人类扩散模式提供支持。 文件详解 压缩文件 文件名称:lexibank/grollemundbantu-v1.1.zip 文件格式:ZIP...
-
CLDF_Based_Proto_Purus原始语语音重建数据集2021
2026年1月22日 30 198 25
数据集概述 本数据集是基于de Carvalho 2021年发表的《Proto-Purus(阿拉瓦克语系)音段音系比较重建》研究生成的CLDF格式数据集,包含Proto-Purus原始语的语音重建相关数据,为语言学领域的原始语重建研究提供结构化参考。 文件详解 文件名称:lexibank/carvalhopurus-v1.1.zip 文件格式:ZIP...
-
Phlorest_Based_Pama_Nyungan语言系统发育树数据
2026年1月22日 30 72 66
数据集概述 本数据集是基于Bouckaert等人2018年发表的《澳大利亚Pama-Nyungan语言的起源与扩张》研究生成的Phlorest系统发育树数据,用于记录和分析澳大利亚Pama-Nyungan语言的演化关系,为语言学研究提供结构化的系统发育参考。 文件详解 文件名称:phlorest/bouckaert_et_al2018-v1.1.zip...
-
Lee_Hasegawa_Based_Ainu语言时空演化CLDF数据集
2026年1月21日 30 137 110
数据集概述 本数据集是基于Lee和Hasegawa 2013年发表的《Ainu Language in Space and Time》研究生成的CLDF格式数据集,包含与阿伊努语言时空演化相关的语言数据,以压缩文件形式存储,是研究阿伊努语言演化的结构化参考资料。 文件详解 文件名称:lexibank/leeainu-v1.2.zip 文件格式:ZIP...
-
Proto_Uralic_Based_乌拉尔语同源词分布附录数据_2022
2026年1月21日 30 113 9
数据集概述 本数据集为论文《Drastic demographic events triggered the Uralic spread》的附录,包含精选的原始乌拉尔语(Proto-Uralic)同源词及其分布信息,用于支撑乌拉尔语系扩散相关的研究分析,共包含1个文件。 文件详解 文件名称:PU_cognates.xlsx 文件格式:XLSX...
-
Anindilyakwa_Based_澳大利亚北部语言同源词研究论文附录数据
2026年1月20日 30 100 76
数据集概述 本数据集为论文《The genetic Position of Anindilyakwa》的附录数据,包含澳大利亚北部语言Anindilyakwa、Wubuy与Ngandi之间已发现的所有同源词信息,共收录2个文件,用于支持该语言遗传学研究的相关分析。 文件详解 App1_Swadesh_new.xlsx 文件格式:XLSX...
-
-
Indo_Iranian_Uralic_Based_乌拉尔语系印伊语借词分布数据
2026年1月19日 30 91 1
数据集概述 本数据集是Grünthal等人2022年论文《Drastic demographic events triggered the Uralic spread》的附录,整理了乌拉尔语系中的早期印伊语借词及其分布情况,数据来源于赫尔辛基大学Samppa Holopainen 2019年博士论文。 文件详解...
-
Phlorest_Based_Pama_Nyungan语言系统发育分析数据集2012
2026年1月18日 30 140 99
数据集概述 本数据集为基于Bowern & Atkinson 2012年研究的Phlorest系统发育树数据,核心内容是Pama-Nyungan语言的内部结构计算系统发育分析结果,用于支持语言演化和分类研究,数据集包含1个压缩文件。 文件详解 文件名称:phlorest/bowern_and_atkinson2012-v1.1.zip...
-
Universal_attractors_Based语言演化普遍吸引子研究数据集
2026年1月15日 30 179 148
数据集概述 本数据集是论文“Universal attractors in language evolution provide evidence for the kinds of efficiency pressures...
-
Oceanic_barriers_Based日本群岛海洋屏障语言多样性量化研究数据
2026年1月15日 30 55 49
数据集概述 本数据集为验证地理屏障对语言多样性影响的研究辅助数据,支持量化分析日本群岛海洋屏障对词汇多样性的作用。研究采用进化生物学方法,通过基础词汇β多样性测量,结合地理邻近性与海洋隔离因素,揭示海洋屏障对日本语言词汇变异的独立解释力,并验证结果可推广至阿伊努语系。 文件详解 文件名称:SI.xlsx 文件格式:XLSX...
-
Phlorest_Lee_Hasegawa_日语系语言农业起源系统发育树研究数据2011
2026年1月13日 30 159 106
数据集概述 本数据集为基于Lee & Hasegawa 2011年研究构建的Phlorest系统发育树数据,核心内容是支持日语系语言农业起源假说的贝叶斯系统发育分析结果,以压缩文件形式提供,用于语言演化研究领域的相关分析。 文件详解 文件名称:phlorest/lee_and_hasegawa2011-v1.1.zip...
-
Supplementary_material_5_Based_古东斯拉夫与现代斯拉夫语言距离测量实验结果数据
2025年12月28日 30 187 63
数据集概述 本数据集是基于语料库的语言距离测量实验结果,涵盖古东斯拉夫、现代东斯拉夫及现代标准斯拉夫语言变体。包含240个实验文件夹及1个汇总CSV文件,实验参数涉及主题反建模启发式、 Sørensen-Dice系数归一化、混合度量策略等,现代标准斯拉夫数据集还按不同规模占比(0.1、0.3、0.6、1)重复实验。 文件详解 汇总文件...
-
Jackknifing_the_Black_Sheep论文附录_ASJP分类性能与南岛语系数据集
2025年12月22日 30 29 2
数据集概述 本数据集包含《Jackknifing the Black Sheep》论文的两个附录,聚焦ASJP分类性能与南岛语系语言研究,涵盖南岛语系语言树状图及1137种语言变体的分类与参数数据。 文件详解 文件名称:Appendix1_AustronesianTree.pdf 文件格式:PDF 内容:南岛语系语言的ASJP树状图,呈现语言谱系关系...
-
基尔南亚语言类型学数据库
2025年12月22日 30 177 111
数据集概述 该数据库包含南亚地区42种语言(涵盖印欧、达罗毗荼等语系及孤立语言)的语言类型学特征数据,涉及语法、否定策略等230个特征,部分特征源自Grambank数据库,为语言学研究提供基础数据支持。 文件详解 文件名称: Kiel_Corpus_data.csv 文件格式: CSV 字段映射:...



