找到213个数据集

标签: 历史语言学

过滤结果
  • Proto_Uralic_Based_乌拉尔语同源词分布附录数据_2022

    2026年1月21日   

    数据集概述 本数据集为论文《Drastic demographic events triggered the Uralic spread》的附录,包含精选的原始乌拉尔语(Proto-Uralic)同源词及其分布信息,用于支撑乌拉尔语系扩散相关的研究分析,共包含1个文件。 文件详解 文件名称:PU_cognates.xlsx 文件格式:XLSX...
    packageimg
  • Sims_Based_Proto_Rma声调历时研究CLDF数据集2020

    2026年1月21日   

    数据集概述 本数据集是基于Sims 2020年发表的《Reconsidering the diachrony of tone in Rma》一文生成的CLDF格式数据集,核心内容为Proto-Rma声调历时演变的相关语言数据,为语言学研究提供结构化的声调演变分析基础。 文件详解 文件名称:lexibank/simsrma-v1.3.zip...
    packageimg
  • Anindilyakwa_Based_澳大利亚北部语言同源词研究论文附录数据

    2026年1月20日   

    数据集概述 本数据集为论文《The genetic Position of Anindilyakwa》的附录数据,包含澳大利亚北部语言Anindilyakwa、Wubuy与Ngandi之间已发现的所有同源词信息,共收录2个文件,用于支持该语言遗传学研究的相关分析。 文件详解 App1_Swadesh_new.xlsx 文件格式:XLSX...
    packageimg
  • Starostin_Karen_Based语族斯瓦迪士词表标注数据集2017

    2026年1月20日   

    数据集概述 本数据集为CLDF格式,源自Starostin 2017年发布的《Karen语族标注斯瓦迪士词表》,包含该语族的斯瓦迪士词表标注内容,支持语言词汇统计学研究,仅含一个压缩文件。 文件详解 文件名称:lexibank/starostinkaren-v1.0.zip 文件格式:ZIP...
    packageimg
  • Entangled_Histories_佛兰德斯议会法令集转录数据集_1787

    2026年1月20日   

    数据集概述 本数据集为1787年出版的《佛兰德斯议会法令、公告、特许状等汇编及国务委员会相关判决》第6卷的转录版本。内容包括佛兰德斯议会登记的官方文件及特定管辖范围内的国务委员会判决,是研究18世纪佛兰德斯地区法律与行政历史的重要原始文献。 文件详解 文件名称:OXFORD555082878.zip 文件格式:ZIP...
    packageimg
  • IN02025_Based_Kisipidi石碑梵语Epidoc草稿XML数据

    2026年1月20日   

    数据集概述 本数据集为IN02025号482年Kisipidi石碑的梵语文本数据,采用Epidoc格式的XML文件存储(无元数据),是拟纳入“Siddham”档案的草稿版本。数据集包含1个XML文件,无目录层级,未进行训练/测试、数据/标签或原始/处理的拆分。 文件详解 文件名称:IN02025.xml 文件格式:XML...
    packageimg
  • Areal_diachronic_Slavic_论元标记时空趋势研究修正数据集

    2026年1月20日   

    数据集概述 本数据集是论文《Areal and diachronic trends in argument flagging across Slavic》的修正版数据库,由多所高校及研究机构合作构建,聚焦斯拉夫语系中论元标记的区域分布与历时演变趋势。数据集包含一个文件,为语言学研究提供结构化的分析基础。 文件详解...
    packageimg
  • Indo_Iranian_Uralic_Based_乌拉尔语系印伊语借词分布数据

    2026年1月19日   

    数据集概述 本数据集是Grünthal等人2022年论文《Drastic demographic events triggered the Uralic spread》的附录,整理了乌拉尔语系中的早期印伊语借词及其分布情况,数据来源于赫尔辛基大学Samppa Holopainen 2019年博士论文。 文件详解...
    packageimg
  • Neo_Assyrian_Oracc_Based新亚述语料库族名分布模式研究数据

    2026年1月19日   

    数据集概述 本数据集是论文“Broad-scale patterns in the distribution of ethnic names in the Neo-Assyrian Oracc corpus”的关联表格与列表,包含8个文件,涉及族名分布的语义分析、拼写标准化、文本类型分类等内容,用于支撑新亚述Oracc语料库中族名分布模式的研究。...
    packageimg
  • Universal_Concepts_List_印欧语系17种语言通用概念列表数据

    2026年1月18日   

    数据集概述 本数据集为印欧语系17种代表性古今语言的通用概念列表,基于Swadesh 1971年最终版100词概念表构建,包含原始印欧语同源词干及各语言对应的“无标记”日常翻译。数据为研究中的摘要列表,未完全格式化,主要用于语言年代学分析。 文件详解 文件名称:Universal concept list for 17 Indo-European...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育分析数据集2012

    2026年1月18日   

    数据集概述 本数据集为基于Bowern & Atkinson 2012年研究的Phlorest系统发育树数据,核心内容是Pama-Nyungan语言的内部结构计算系统发育分析结果,用于支持语言演化和分类研究,数据集包含1个压缩文件。 文件详解 文件名称:phlorest/bowern_and_atkinson2012-v1.1.zip...
    packageimg
  • Ethiosemitic_Based埃塞俄比亚闪米特语言分类与决定因素数据集2021

    2026年1月18日   

    数据集概述 本数据集是基于Feleke 2021年研究“Ethiosemitic languages: classifications and classification determinants”构建的CLDF格式数据集,包含埃塞俄比亚闪米特语言的分类及分类决定因素相关数据,为语言分类研究提供结构化资源。 文件详解 压缩文件...
    packageimg
  • Concepticon_CLDF_Concepticon_3_4_0概念列表链接资源数据集

    2026年1月17日   

    数据集概述 本数据集是Concepticon 3.4.0版本的CLDF格式资源,由List等学者编辑,旨在为概念列表的链接提供支持。它由马克斯·普朗克进化人类学研究所发布,可在线获取,包含一个压缩文件,无训练测试或数据标签等拆分结构。 文件详解 文件名称:concepticon/concepticon-cldf-v3.4.0.zip 文件格式:ZIP...
    packageimg
  • OLIVEIRA_Contribuições_Proto_Panoan重建贡献数据集2014

    2026年1月17日   

    数据集概述 本数据集源自Oliveira 2014年题为《Contribuições para a Reconstrução do Protopáno》的研究,是基于CLDF格式的Proto-Panoan语言重建相关数据,支持历史语言学领域对Proto-Panoan语言的研究与分析,共包含1个压缩文件。 文件详解 压缩文件 文件名称:pano-...
    packageimg
  • Kassian_Pannonian_Based潘诺尼亚西斯拉夫语方言词汇补充材料数据2025

    2026年1月17日   

    数据集概述 本数据集是论文《潘诺尼亚作为西斯拉夫语言:方言词汇》的补充材料,包含匈牙利语中的早期斯拉夫借词列表,用于支持潘诺尼亚语言归属西斯拉夫语系的语言学研究,为相关语言演变分析提供基础数据。 文件详解 文件名称:Kassian_Pannonian_supplement_2015.docx 文件格式:DOCX...
    packageimg
  • Raja_Ampat_South_Halmahera_拉贾安帕特14种南岛语变体词汇比较数据

    2026年1月17日   

    数据集概述 本数据集为Excel表格,包含新几内亚西北部拉贾安帕特群岛14种近缘南岛语变体的词汇比较数据,涉及354个概念下的489组比较项,记录语音、声调、重音等信息,支持南岛语族语言的历史语言学分析。 文件详解 文件名称:RA-TonalCorrespondences-vFinal.xlsx 文件格式:XLSX 字段映射介绍:含3个工作表...
    packageimg
  • SFB_table_Gothic_Based_哥特语配价类系统复杂度变异性限制数据

    2026年1月14日   

    数据集概述 本数据集围绕哥特语配价类系统复杂度的变异性限制展开,包含一份SFB项目相关的表格文件,聚焦哥特语语法中配价类系统的复杂度特征与变异性边界,为语言学领域关于哥特语语法系统的研究提供数据支持。 文件详解 文件名称:SFB_table_all_folders.xlsx 文件格式:XLSX...
    packageimg
  • Polyglotta_Africana_Based_非洲语言词汇比较数据集_v2_1

    2026年1月14日   

    数据集概述 本数据集基于Koelle 1854年的《Polyglotta Africana》,包含非洲一百多种语言中近三百个词汇和短语的比较词汇表,以CLDF格式整理,为非洲语言比较研究提供结构化资源。 文件详解 文件名称:lexibank/polyglottaafricana-v2.1.zip 文件格式:ZIP(压缩包)...
    packageimg
  • IN02019_Based_Pasupati_Sivalinga底座梵语XML草案数据

    2026年1月14日   

    数据集概述 本数据集为IN02019号文物(Abhiri的Pasupati Sivalinga底座)的梵语文本XML文件,采用Epidoc格式草案版本,无元数据,计划纳入"Siddham"档案。数据核心为该梵语铭文的数字化文本,支持考古与梵语文献研究。 文件详解 文件名称:IN02019.xml 文件格式:XML...
    packageimg
  • CLDF_Gravinas_Proto_Central_Chadic语言重建数据2014

    2026年1月13日   

    数据集概述 本数据集为CLDF格式,源自Gravina 2014年的博士论文《原始中乍得语语音学》,包含原始中乍得语的语音学重建、词汇重建及中乍得语族的语言史相关数据,是研究中乍得语族语言演变的基础资料,总计包含一个压缩文件。 文件详解 文件名称:lexibank/gravinachadic-v1.0.zip 文件格式:ZIP...
    packageimg