找到72个数据集

标签: 词汇特征

过滤结果
  • Wangerooge_Frisian_Based_已灭绝东弗里斯兰语录音转录数据集

    2026年1月15日   

    数据集概述 本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。 文件详解 压缩包文件(Archive files) 文件名称:包括rec-br-...
    packageimg
  • Polyglotta_Africana_Based_非洲语言词汇比较数据集_v2_1

    2026年1月14日   

    数据集概述 本数据集基于Koelle 1854年的《Polyglotta Africana》,包含非洲一百多种语言中近三百个词汇和短语的比较词汇表,以CLDF格式整理,为非洲语言比较研究提供结构化资源。 文件详解 文件名称:lexibank/polyglottaafricana-v2.1.zip 文件格式:ZIP(压缩包)...
    packageimg
  • IN02019_Based_Pasupati_Sivalinga底座梵语XML草案数据

    2026年1月14日   

    数据集概述 本数据集为IN02019号文物(Abhiri的Pasupati Sivalinga底座)的梵语文本XML文件,采用Epidoc格式草案版本,无元数据,计划纳入"Siddham"档案。数据核心为该梵语铭文的数字化文本,支持考古与梵语文献研究。 文件详解 文件名称:IN02019.xml 文件格式:XML...
    packageimg
  • Cáo_Mò_Zhī_Zhèn_Based_曹沫之陳竹简文献数字版本CLDF数据_2025

    2026年1月13日   

    数据集概述 本数据集提供支撑《曹沫之陳》数字版本的CLDF格式数据,由Pulini和List于2025年发布。数据用于填充该古代汉语竹简文献的数字化版本,是研究先秦文献数字化标注方法的基础资源。 文件详解 文件名称:caomozhizhen-v0.2.zip 文件格式:ZIP(压缩包)...
    packageimg
  • IN01018_Sanskrit_Based_Jayaraja_Mallar授权文书梵语文本数据

    2026年1月9日   

    数据集概述 本数据集包含编号为IN01018的Jayaraja Mallar授权文书(5年)的梵语XML文件,无附加元数据。文件总数为1,仅包含原始梵语文本内容,未进行训练测试、数据标签或原始处理等拆分,是研究古梵语授权文书的基础资料。 文件详解 文件名称:IN01018.xml 文件格式:XML 字段映射介绍:包含Jayaraja...
    packageimg
  • Factoring_lexical_phonetic_phylogenetic_研究辅助材料数据

    2026年1月9日   

    数据集概述 本数据集为论文“Factoring lexical and phonetic phylogenetic characters from word lists”的辅助材料,包含分析所需的脚本与数据文件,支持复现研究内容。文件涵盖结果文本、代码脚本、配置文件等,共十六个文件,可通过README.md了解使用细节。 文件详解 文档类文件...
    packageimg
  • IN01043_Based_Visnuvarman第9年Mudigere特许状梵语XML文本数据

    2026年1月8日   

    数据集概述 本数据集为IN01043号文献,即Visnuvarman第9年颁发的Mudigere特许状的梵语文本XML文件。数据不含元数据,仅包含一份核心XML文件,是研究古代梵语铭文、历史特许状文本的数字化资源。 文件详解 文件名称:IN01043.xml 文件格式:XML...
    packageimg
  • UBA000159630_Entangled_Histories_荷兰共和国多省法令汇编转录数据_1705

    2025年12月31日   

    数据集概述 本数据集为1705年出版的荷兰共和国法令汇编《Groot placaet-boeck》的转录数据,收录荷兰省、西弗里西亚省和泽兰省的法令、条例及敕令。基于阿姆斯特丹大学图书馆藏本转录,由KB荷兰皇家图书馆数字化,用于历史法律文献研究。 文件详解 文件名称:UBA000159630.zip 文件格式:ZIP...
    packageimg
  • Lower_Fungom_Mundabli_Based_非洲语言词汇数字化完整数据

    2025年12月24日   

    数据集概述 该数据集为Mundabli语言的225词表,Mundabli属Yemne-Kimbi语组,通行于喀麦隆西北部Menchum区Fungom分区Lower Fungom地区,语言有声调且名词前缀演变为修饰语一致标记,词表包含两位顾问提供的词汇及个体变异。 文件详解...
    packageimg
  • Archi_Text_Corpus_Based_阿奇语2006_2007年语料库完整数据

    2025年12月23日   

    数据集概述 本数据集为阿奇语语料库,包含2006-2007年在阿奇村收集的50余篇多体裁文本,涵盖故事、对话、传说、歌曲等,多数配有音视频记录。内容包含重新录制的1977年已发表文本及新采集文本,本版本文本均源自1977年出版的《阿奇语:文本与词典》。 文件详解 文档文件(共66个,包含两种格式):...
    packageimg
  • 菲特拉特作品中表达社会政治关系的复合词汇数据集

    2025年12月22日   

    数据集概述 本数据集围绕菲特拉特作品中使用的复合词汇展开研究,重点分析其作为表达社会政治关系的语义词汇群体的特征,为理解相关文本的社会政治内涵提供数据支持。 文件详解 文件名称:Mirzatillayeva Sayyoraxon Zokirjon qizi.pdf 文件格式:PDF...
    packageimg
  • 东印度尼西亚语言LexiRumah数据库v3_0_1

    2025年12月22日   

    数据集概述 该数据集是东印度尼西亚语言的LexiRumah数据库,版本为v3.0.1。以压缩包形式存储,包含相关语言数据,为研究东印度尼西亚语言提供数据支持。 文件详解 文件名称:lessersunda/lexirumah-data-v3.0.1.zip 文件格式:ZIP(.zip)...
    packageimg
  • 北京大学1964年汉语方言词汇CLDF数据集

    2025年12月21日   

    数据集概述 该数据集是基于北京大学1964年《汉语方言词汇》的CLDF格式数据集,包含汉语方言词汇相关内容,以压缩包形式存储,为方言词汇研究提供结构化数据支持。 文件详解 文件名称:lexibank/beidasinitic-v5.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • IN02063_Maligaon_Based_石刻铭文翻译文本完整数据

    2025年12月20日   

    数据集概述 该数据集包含IN02063 Maligaon石刻铭文的翻译文件,通过PDF和DOCX两种格式呈现,为研究该石刻铭文的内容提供了可访问的文本资源。 文件详解 文件名称: IN02063 CVII Maligaon Inscription.pdf 文件格式: PDF (.pdf) 内容说明: Maligaon石刻铭文的翻译文档,以PDF格式存储...
    packageimg
  • 世界语言结构地图集在线版2014

    2025年12月20日   

    数据集概述 本数据集为2014年7月发布的《世界语言结构地图集在线版》压缩包,包含全球语言结构特征的相关数据,是研究语言多样性与类型学的重要资源。 文件详解 文件名称: wals3-v2014.2.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含《世界语言结构地图集在线版》2014年版本的相关数据文件,具体内容需解压后查看 数据来源 Max...
    packageimg
  • 未提供_Lower_Fungom_Missong_Based_语言研究词汇变异完整数据

    2025年12月19日   

    数据集概述 该数据集为Lower Fungom地区Missong语言的225词表,Missong属于Yemne-Kimbi语组,具有声调及名词前缀特征。词表记录了两位咨询者的词汇变异,变异与社会语言学特征差异相关。 文件详解 文件名称:...
    packageimg
  • 尼泊尔部分语言词汇表数据集1973

    2025年12月19日   

    数据集概述 该数据集是基于Hale 1973年《尼泊尔部分语言词汇表》衍生的CLDF格式数据集,包含尼泊尔特定语言的词汇信息,为语言研究提供结构化数据支持。 文件详解 文件名称:lexibank/halenepal-v4.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 基于2015年Castro_水语方言研究_的CLDF数据集

    2025年12月18日   

    数据集概述 该数据集是基于2015年Castro《水语方言研究》的CLDF格式数据集,核心内容为水语方言相关研究数据,以压缩包形式存储,未提供具体内容预览。 文件详解 文件名称: lexibank/castrosui-v3.1.zip 文件格式: ZIP压缩包 内容说明: 未提供文件内部字段或内容预览,仅包含1个压缩包文件 数据来源 Castro,...
    packageimg
  • XOJA_Based_作品词汇特征分析完整数据

    2025年12月16日   

    数据集概述 本数据集包含一份关于XOJA作品词汇特征的PDF文档,聚焦XOJA作品的词汇相关研究内容,为相关语言或文学领域的分析提供资料支持。 文件详解 文件名称: Danabekov Ozodbek Imomali o‘g‘li.pdf 文件格式: PDF (.pdf) 文件内容: 文档围绕XOJA作品的词汇特征展开,具体内容需查阅PDF文件获取...
    packageimg
  • AUTOTYP_Database_1_1_1_Based_语言类型学研究数据完整集合

    2025年12月16日   

    数据集概述 该数据集是AUTOTYP大型研究项目的成果,聚焦语言类型学的定量与定性研究。此版本包含AUTOTYP数据库的完整原始数据、元数据、聚合数据集及聚合脚本,版本为1.1.1,主要优化了MaximallyInflectedVerbSynthesis数据集的CLDF导出功能。 文件详解 文件名称: autotyp-data-v.1.1.1.zip...
    packageimg