找到46个数据集

标签: 词汇演变

过滤结果
  • IDS国际大词典系列_2021汉语IDS词表数据

    2026年2月9日 30 131 108

    数据集概述 本数据集为Hsiao-jung Yu与Yifan Wang于2021年编制的汉语IDS词表,收录于《洲际词典系列》(The Intercontinental Dictionary Series)。该词表是汉语语言学研究的结构化资源,可用于汉语词汇、语义等相关领域的分析,数据集包含1个压缩文件。 文件详解 压缩文件...
    packageimg
  • Kam_Niger_Congo_Based语言比较词表数据

    2026年1月30日 30 9 2

    数据集概述 本数据集是基于莱比锡-雅加达词表收集的比较词表,用于对比Kam语与其他尼日尔-刚果语族语言的基础词汇。包含文献中已有的多种原始语言(如Jukunoid、Mumuyic、原始班图语等)的重构数据,以及作者对尼日尔-刚果语族、贝努埃-刚果语支等的准重构内容和同源词判断,仅包含一个文件。 文件详解 文件名称:Lesage2024-Kam-...
    packageimg
  • MaReTE_Based_古埃及象形文字词汇音译模型数据_2023

    2026年1月27日 30 106 5

    数据集概述 本数据集包含基于Ramses音译语料库和AES古埃及语句料库构建的古埃及象形文字词汇音译模型,用于实现象形文字到现代文字的音译转换。数据集提供训练好的模型文件、辅助文件及源码,支持古埃及文字数字化研究,共包含9个文件。 文件详解 文档类文件 文件名称:Readme.txt 文件格式:TXT...
    packageimg
  • Nicobarese_Source语言系统发育分析词表数据2021

    2026年1月27日 30 163 149

    数据集概述 本数据集基于改良的Swadesh 100词表,用于分析尼科巴语支的内部语言分支关系。尼科巴语支包含约七种语言,多数仅部分记录,仅两种语言有详细词典和语法描述,数据处理难度较高。数据集支持作者2021年在瑞典隆德ICAAL会议发表的论文及后续版本。 文件详解 文件名称:Nicobarese 100 lexicon+Nexus.xlsx...
    packageimg
  • Deepadung_Based_Palaung方言词汇比较数据集v1_3

    2026年1月22日 30 1 0

    数据集概述 本数据集源自Deepadung等人2015年发表的《中缅泰Palaung方言词汇比较》研究,以CLDF格式整理了Palaung方言的词汇对比数据,包含中国、缅甸、泰国三地Palaung方言的词汇信息,为语言多样性研究提供结构化资源。 文件详解 压缩包文件 文件名称:lexibank/deepadungpalaung-v1.3.zip...
    packageimg
  • Starostin_Karen_Based语族斯瓦迪士词表标注数据集2017

    2026年1月20日 30 44 38

    数据集概述 本数据集为CLDF格式,源自Starostin 2017年发布的《Karen语族标注斯瓦迪士词表》,包含该语族的斯瓦迪士词表标注内容,支持语言词汇统计学研究,仅含一个压缩文件。 文件详解 文件名称:lexibank/starostinkaren-v1.0.zip 文件格式:ZIP...
    packageimg
  • Hunter_Gatherer_Based_语言数据库衍生CLDF数据集_2021版

    2026年1月18日 30 61 59

    数据集概述 本数据集是基于Bowern等人2021年的《Hunter-Gatherer Language Database》生成的CLDF格式数据集,包含1个压缩文件,旨在为语言学研究提供结构化的狩猎采集者语言相关数据,便于跨研究场景的复用与分析。 文件详解 压缩文件 文件名称:lexibank/huntergatherer-v2.1.zip...
    packageimg
  • CreoPhonPt_Repository_葡萄牙克里奥尔语语音词汇数据集1_0

    2026年1月15日 30 175 81

    数据集概述 本数据集为CreoPhonPt 1.0,是一个整合葡萄牙语基础克里奥尔语语音学和词汇相关数据的资源库,旨在让这些语言的数据更易获取和整理,以促进定量分析。该项目仍在开发中,包含一个压缩文件。 文件详解 文件名称:CreoPhonPt-creoles.zip 文件格式:ZIP...
    packageimg
  • Blust_Austronesian_Based南岛语基础词汇数据库数据_2008

    2026年1月15日 30 85 30

    数据集概述 本数据集是基于Blust的南岛语数据编码而来的CLDF数据集,用于南岛语基础词汇数据库。数据集源自2008年的研究,包含一个压缩文件,无训练/测试、数据/标签或原始/处理数据的拆分,无自述文件或内容预览。 文件详解 SequenceComparison/blustaustronesian-v1.1.zip 文件格式:ZIP...
    packageimg
  • CLDF_Gravinas_Proto_Central_Chadic语言重建数据2014

    2026年1月13日 30 38 2

    数据集概述 本数据集为CLDF格式,源自Gravina 2014年的博士论文《原始中乍得语语音学》,包含原始中乍得语的语音学重建、词汇重建及中乍得语族的语言史相关数据,是研究中乍得语族语言演变的基础资料,总计包含一个压缩文件。 文件详解 文件名称:lexibank/gravinachadic-v1.0.zip 文件格式:ZIP...
    packageimg
  • CLDF_Dogon_Comparative_Wordlist_语言比较研究数据集2016

    2026年1月13日 30 180 121

    数据集概述 本数据集是基于Heath等人2016年的《Dogon Comparative Wordlist》衍生的CLDF格式数据集,由Moran、Forkel和Heath编辑,记录Dogon语言的比较词表信息,为语言学研究提供结构化数据支持。 文件详解 文件名称:heathdogon-v0.3.zip 文件格式:ZIP...
    packageimg
  • IN01004_Podagadh_Based_Skandavarman毗湿奴足迹梵语铭文XML数据

    2026年1月6日 30 208 48

    数据集概述 本数据集包含IN01004号梵语铭文XML文件,内容为Skandavarman时期毗湿奴足迹相关的Podagadh基金会铭文,无附加元数据。数据集仅含一个文件,用于梵语铭文的数字化保存与文本分析。 文件详解 文件名称:IN01004.xml 文件格式:XML...
    packageimg
  • CLDF_Based_South_American_Languages_Borrowing研究数据集2023

    2025年12月28日 30 184 137

    数据集概述 本数据集是Miller和List在2023年发表的《South American Languages Borrowing》研究的配套CLDF数据集,包含1个压缩文件,用于支持对南美洲语言词汇借用现象的检测与分析研究,文件存储于单层目录结构中。 文件详解 压缩文件 文件名称:lexibank/sabor-v1.0.zip 文件格式:ZIP...
    packageimg
  • 俄罗斯维吾尔乌兹别克人名变化的语言和超语言因素分析

    2025年12月23日 30 178 135

    数据集概述 该数据集聚焦俄罗斯维吾尔乌兹别克人名的变化现象,从语言和超语言因素两个维度展开分析,通过单篇PDF文档呈现相关研究内容,为探究人名演变的内外驱动机制提供资料支持。 文件详解 文件名称:S. S. Ibragimova.pdf 文件格式:PDF...
    packageimg
  • 藏缅语音和词汇CLDF数据集1991

    2025年12月23日 30 196 108

    数据集概述 该数据集是基于孙宏开1991年出版的《藏缅语音和词汇》构建的CLDF格式数据集,核心内容为藏缅语族语言的语音与词汇相关数据,为语言比较研究提供标准化数据支持。 文件详解 文件名称:lexibank/suntb-v4.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 哥廷根印度语言电子文本注册吠陀数据集

    2025年12月23日 30 189 150

    数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于吠陀(VEDA)的电子文本集合,包含37个HTML格式文件,主要为吠陀相关文本内容,未划分训练测试集、数据标签或原始/处理数据,为印度语言及吠陀文本研究提供基础资料。 文件详解 该数据集包含37个HTML格式文件,具体说明如下: - 文件类型: 所有文件均为.htm格式,占比100%...
    packageimg
  • 英语历时词用法图数据集_DWUG_EN

    2025年12月22日 30 193 127

    数据集概述 该数据集包含英语的历时词用法图(WUGs),记录词汇用法随时间的变化。数据格式、处理代码及更多相关资源可通过WUGsite获取,为研究词汇语义演变提供支持。 文件详解 文件名称:dwug_en.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含英语历时词用法图的相关数据,具体文件结构与字段信息需解压后查看,未提供预览内容 适用场景...
    packageimg
  • 英语历史中的外来词数据集

    2025年12月21日 30 159 33

    数据集概述 该数据集围绕英语历史中的外来词主题,包含一份相关文档,为研究英语中外来词的历史演变提供资料支持。 文件详解 文件名称: Gadoeva Mavlyuda Ibragimovna.pdf 文件格式: PDF (.pdf) 内容说明: 文档内容围绕英语历史中的外来词展开,具体字段映射未提供。 适用场景 语言学研究:...
    packageimg
  • 基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017

    2025年12月21日 30 194 3

    数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 德国报纸中女足与男足词汇使用频率数据集1970_2022

    2025年12月21日 30 140 92

    数据集概述 该数据集包含1970年至2022年间,德国报纸及其他书面来源中“Frauenfußball”(女足)和“Männerfußball”(男足)两个词汇形式的使用频率聚合数据,为分析德国女足与男足关注度的历史变化提供支持。 文件详解 文件名称:Frauenfussball_Maennerfussball_DeReKo.csv,文件格式:CSV...
    packageimg