找到19个数据集

标签: 词汇资源

过滤结果
  • DWDS_Based_德语词源词典完整词条列表数据

    2026年1月31日 30 74 51

    数据集概述 本数据集为《德语词源词典》的词条列表,收录约24500个德语词汇,包含每个词汇在数字德语词典(DWDS)中的对应文章URL。该词典由沃尔夫冈·普法伊费尔领导的团队编写,涵盖词汇的年代、起源、亲属关系及词义演变等信息,是德语词源研究的重要参考资料。 文件详解 文件名称:etymwb-headwords.json 文件格式:JSON...
    packageimg
  • CLDF_NorthPeruLex_秘鲁北部小语种词汇数据集

    2026年1月29日 30 104 56

    数据集概述 本数据集为基于CLDF格式的词汇数据集,源自Ugarte等人即将发布的"NorthPeruLex"项目,收录秘鲁北部小语种家族及孤立语言的词汇信息,为该区域语言研究提供结构化数据支持。 文件详解 主文件包 文件名称:lexibank/northperulex-v0.2.zip 文件格式:ZIP...
    packageimg
  • Vocabulary_Workshop_2021词汇工具目录参考数据

    2026年1月26日 30 88 80

    数据集概述 本数据集为2021年词汇研讨会生成的词汇工具目录草案副本,在2022年词汇研讨会中被提及。目录由多位参与者合作创建,旨在汇总词汇工具信息,帮助用户解决词汇工具选择问题,包含一份Excel格式文件。 文件详解 文件名称:Catalogue of Vocabulary tools from 2021 workshop - referred to...
    packageimg
  • Deepadung_Based_Palaung方言词汇比较数据集v1_3

    2026年1月22日 30 72 58

    数据集概述 本数据集源自Deepadung等人2015年发表的《中缅泰Palaung方言词汇比较》研究,以CLDF格式整理了Palaung方言的词汇对比数据,包含中国、缅甸、泰国三地Palaung方言的词汇信息,为语言多样性研究提供结构化资源。 文件详解 压缩包文件 文件名称:lexibank/deepadungpalaung-v1.3.zip...
    packageimg
  • Mondzish_Based_中国采集词汇录音转录数据库_2012_2015

    2026年1月20日 30 134 62

    数据集概述 本数据集为Mondzish(Mangish)词汇数据库,包含2012-2015年在中国采集的音频录音转录内容,是单一文件的词汇资源,可用于Mondzish语言的词汇研究与分析。 文件详解 文件名称:Mondzish_lexical_database.xlsx 文件格式:XLSX...
    packageimg
  • Buddhist_Translators_Workbench_佛教梵语词汇资源词典数据集

    2026年1月13日 30 15 5

    数据集概述 本数据集是为佛教梵语词汇资源“佛教翻译工作台”概念验证开发的词典数据,包含2012-2016年的9个XML文件,记录佛教梵语词汇相关信息,曾获美国国家人文基金会资助,现迁移至新平台。 文件详解 词典数据文件(共9个) 文件名称:vikalpa.xml、prasāda.xml、saṃkalpa.xml、vi√kḷp.xml、abhi-...
    packageimg
  • Ajumbu_Lower_Fungom_Based_阿琼布语500名词词表完整数据

    2025年12月23日 30 11 6

    数据集概述 本数据集为Ajumbu语言的500个名词词表,Ajumbu是喀麦隆西北部Menchum区Fungom分区Lower Fungom地区使用的Yemne-Kimbi语言变体,具有声调特征和名词类词缀,因使用者生活经历差异存在个体变异。 文件详解 文件名称: KPAAMCAM_NTs_AJUMBU-500 NOUNS...
    packageimg
  • 僧伽罗语梵语数字词汇表2_0_A至M

    2025年12月23日 30 129 50

    数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
    packageimg
  • KPAAMCAM_NTs_FANG_Based_225词表语言特征分析完整数据

    2025年12月23日 30 100 10

    数据集概述 该数据集为喀麦隆西北部Lower Fungom地区Fang语的225词表,Fang语属Yemne-Kimbi语族,具声调、名词前缀及动词词缀变化,含两位顾问提供的词汇变体数据,变体与社会语言学特征差异相关。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: -...
    packageimg
  • Lower_Fungom_Ngun_Based_喀麦隆Ngun语言词汇资源数据集

    2025年12月22日 30 200 48

    数据集概述 该数据集为Ngun语言的225词表,Ngun是蒙巴姆语的一种变体,属于也门-金比语族,使用于喀麦隆西北部Menchum省Fungom分区的Lower Fungom地区,语言具有声调及名词前缀特征,记录了两位顾问间的词汇变异。 文件详解 文件名称:...
    packageimg
  • KPAAMCAM_IDP_Lower_Fungom_Biya_Based_500名词词表完整数据

    2025年12月21日 30 159 31

    数据集概述 该数据集是一份包含500个名词的Biya Mungbam语言词表,Biya Mungbam是喀麦隆西北部Menchum区Lower Fungom地区使用的语言。词表基于两名男女发音人的数据,记录了声调、前缀、词根及名词短语等方面的个体差异。 文件详解 文件名称:KPAAMCAM-IDP_NTs_BIYA 500 NOUNS...
    packageimg
  • 中古荷兰语词汇重音模式与音节划分数据集

    2025年12月21日 30 21 16

    数据集概述 该数据集包含四万八千二百一十九个中古荷兰语词汇,均取自《中古荷兰语》光盘(1998年版)收录的二百零五篇韵文文本。所有词汇均标注了音节划分结果和词汇重音模式,为中古荷兰语语音特征研究提供基础数据。 文件详解...
    packageimg
  • 意大利情感词典Sentix数据集

    2025年12月18日 30 25 8

    数据集概述 本数据集为意大利语情感词典Sentix的压缩文件,包含一个情感词典相关的压缩包,可用于意大利语文本的情感分析相关研究与应用。 文件详解 文件名称: valeriobasile/sentix-v3.0.zip 文件格式: ZIP压缩包(.zip) 文件内容: 压缩包内包含Sentix意大利语情感词典相关数据,具体内容需解压后查看 适用场景...
    packageimg
  • Wichmann_2025_ASJP_Database_Based_语言比较研究CLDF完整数据

    2025年12月11日 30 163 162

    数据集概述 本数据集是基于Wichmann等人2025年发布的"ASJP Database"第21版转换而来的CLDF格式数据集,为语言比较研究提供标准化数据支持。 文件详解 文件名称: lexibank/asjp-v21.zip 文件格式: ZIP压缩包(.zip) 内容说明: 包含ASJP...
    packageimg
  • Dellert_NorthEuraLex_Based_跨语言词汇数据CLDF格式完整数据集

    2025年12月9日 30 206 110

    数据集概述 本数据集是基于Dellert等人2020年发布的"NorthEuraLex (Version 0.9)"转换而来的CLDF(Cross-Linguistic Data Formats)格式数据,为跨语言研究提供标准化资源。 文件详解 文件名称: lexibank/northeuralex-v4.1.zip 文件格式: ZIP压缩包...
    packageimg
  • 俄语多词表达式分布语义模型数据集

    2025年12月9日 30 206 192

    数据集概述 本数据集包含俄语多词表达式,依据名词短语与其中心词意义间是否存在“范畴转换”筛选。含173个存在转换的正向样本和173个无转换的负向样本,标注用于进一步分类,为分布语义模型(DSM)词汇构建提供数据支持。 文件详解 文档文件(PDF格式,共3个): Dataset_part1.pdf:第一部分数据集文档...
    packageimg
  • 图皮语词汇数据库

    2025年12月8日 30 72 8

    数据集概述 该数据集为图皮语词汇数据库(TuLeD),包含图皮语系语言的词汇资源,以压缩文件形式存储,未划分训练测试、数据标签或原始处理数据,为语言研究提供基础词汇数据支持。 文件详解 文件名称:tupian-language-resources/tuled-v0.12.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • Lower_Fungom_Abar_Based_喀麦隆ABAR语言名词词表完整数据

    2025年12月6日 30 112 94

    数据集概述 该数据集为Abar语言的五百名词词表,呈现了喀麦隆西北部Lower Fungom地区Abar语使用者的名词前缀变异现象,包含两位语言顾问提供的词汇相似性与差异性记录,为研究该语言的词汇特征提供基础数据。 文件详解 文件名称: KPAAMCAM_NTs_ ABAR 500 NOUNS WORDLISTS_July2018.pdf 文件格式:...
    packageimg
  • 太平洋数字CLDF数据集2025

    2025年12月5日 30 155 3

    数据集概述 该数据集是基于Barlow编辑的《太平洋数字:南岛语系和巴布亚语言数字术语集》的CLDF格式数据集,包含太平洋地区相关语言的数字术语收集内容。 文件详解 文件名称: numeralbank/barlowpacific-v1.7.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg