找到42个数据集

标签: 词汇分析

过滤结果
  • IN01040_Sanskrit_Based_Mrgesavarman第7年授权文书梵语XML数据

    2026年1月6日 30 98 47

    数据集概述 本数据集包含IN01040号Hiṭnahebbāgilu地区Mṛgeśavarman第7年授权文书的梵语文本XML文件,无元数据。文件数量为1,未划分训练/测试集、数据/标签集或原始/处理集,主要用于梵语历史文献的数字化存储与分析。 文件详解 梵语授权文书文件 文件名称:IN01040.xml 文件格式:XML...
    packageimg
  • IN01022_Sanskrit_Based_Harivarman王5年Halsi授予文书梵语XML数据

    2026年1月1日 30 100 54

    数据集概述 本数据集为IN01022号文献,即Harivarman王5年的Halsi授予文书的梵语XML文件,不含元数据。数据集仅包含一个文件,用于呈现古代印度授予文书的原始梵语文本内容,是研究古代印度历史、文书制度的基础资料。 文件详解 文件名称:IN01022.xml 文件格式:XML...
    packageimg
  • IN02004_Sanskrit_Base_of_Pillar_Inscription梵语铭文XML草稿数据

    2025年12月29日 30 170 100

    数据集概述 本数据集包含IN02004号Changu Narayana柱基铭文的梵语XML文件,为Epidoc格式草稿版,无元数据,计划纳入"Siddham"档案。数据记录该柱基铭文的梵语文本内容,是研究古代铭文文献的基础资料。 文件详解 文件名称:IN02004.xml 文件格式:XML...
    packageimg
  • Nonuya_Language_Based_母语者语言转录词汇数据完整文档

    2025年12月18日 30 136 93

    数据集概述 该数据集收录了Nonuya语言(属于Witoto语系)的八千六百九十三条词汇和表达录音转录文本,涵盖四位母语者的语言材料,包含对原始转录的修订、统一使用AFI符号及添加引用标识符等优化内容。 文件详解 文件名称:NONUYA2019.v4.pdf 文件格式:PDF 内容说明:Nonuya语言转录文本的修订版本文件...
    packageimg
  • Dictionaria_Daakaka_Based_达卡卡语言词典研究完整数据

    2025年12月24日 30 109 38

    数据集概述 该数据集为Daakaka语言词典数据,包含由Kilu Prince于2017年发布的《Daakaka dictionary》内容,是Dictionaria项目的一部分,为研究Daakaka语言提供基础词典资料。 文件详解 文件名称: dictionaria/daakaka-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Zalilex_俄语名词词形变化词典

    2025年12月24日 30 152 96

    数据集概述 该数据集是基于Zaliznyak词典数字化版本提取的俄语名词词形变化词典,包含俄语名词的屈折变化信息,以压缩包形式存储,为俄语词汇形态学研究提供数据支持。 文件详解 文件名称:zalilex-v1.0.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 瓜拉尤语修订词典数据集2019

    2025年12月23日 30 155 18

    数据集概述 该数据集为瓜拉尤语修订词典,由Alfred Hoeller编写,Danielsen、Swintha、Sell、Lena及Terhart、Lena于2019年发布,收录于Dictionaria 7,共1-3590页,提供瓜拉尤语的词汇修订内容。 文件详解 文件名称:dictionaria/guarayu-v1.2.zip...
    packageimg
  • 僧伽罗语梵语数字词汇表2_0_A至M

    2025年12月23日 30 141 58

    数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
    packageimg
  • Dictionaria_Hdi_Dictionary_Based_2017年Hdi语言词典完整数据

    2025年12月22日 30 113 107

    数据集概述 该数据集为Hdi语言的词典数据,由Frajzyngier等学者于2017年发布,收录于Dictionaria 2,共1681页,提供Hdi语言词汇的系统记录,支持语言研究与文献参考。 文件详解 文件名称: dictionaria/hdi-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 阿拉瓦克语言多样性CLDF数据集2019

    2025年12月20日 30 148 141

    数据集概述 本数据集为基于Chacon等人2019年研究的CLDF格式数据,内容围绕20世纪50年代录音资料中的阿拉瓦克语言多样性展开,聚焦里奥内格罗上游地区的语言记录与分析。 文件详解 文件名称: lexibank/chaconbaniwa-v2.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 新词研究_范式与句法特征

    2025年12月19日 30 149 79

    数据集概述 本数据集围绕新词的范式与句法特征展开研究,包含一份相关主题的PDF文档,为新词的语言学特征分析提供基础资料。 文件详解 文件名称:Ismoilova Kamola Rafikovna.pdf 文件格式:PDF (.pdf) 内容说明:该文档为新词研究的相关文献,聚焦其范式与句法特征,具体内容需通过阅读文档获取 适用场景...
    packageimg
  • 词的语义结构中作为内涵成分的表达性作用

    2025年12月18日 30 41 13

    数据集概述 本数据集包含一份关于词的语义结构的研究文档,核心内容围绕表达性作为词的内涵成分的角色展开,为相关语言学或语义学研究提供文献资料支持。 文件详解 文件名称: Navruzova Nigina Khamidovna.pdf 文件格式: PDF (.pdf) 文件内容: 该文档为PDF格式的研究文献,主题为“THE ROLE OF...
    packageimg
  • EDICTOR_3_交互式计算机辅助语言比较工具

    2025年12月9日 30 187 153

    数据集概述 本数据集包含EDICTOR工具的最新稳定版本(3.1版),该工具是一款用于计算机辅助语言比较的交互式软件,可通过edictor.org/直接使用。 文件详解 文件名称: digling/edictor-v3.1.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含EDICTOR 3.1版软件的完整文件,具体文件结构需解压后查看...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日 30 207 125

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • 贝纳方言调查数据集2013

    2025年12月14日 30 54 8

    数据集概述 该数据集是基于2013年Mitterhofer的《贝纳方言调查》的CLDF格式数据集,聚焦贝纳方言词汇表分析,为研究贝纳方言提供结构化数据支持。 文件详解 文件名称:lexibank/mitterhoferbena-v3.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 乌兹别克语语言描述数据集

    2025年12月14日 30 106 49

    数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 诺努亚语标准化书写数据库

    2025年12月14日 30 35 30

    数据集概述 该数据集收录了对诺努亚语(noj,属于维托托语系)的8693条词汇与表达录音的转录内容,由四位母语者参与录制。转录内容采用该语言的标准化书写系统,并为每条转录分配了唯一标识符,便于语言分析工作引用。 文件详解 文件名称:NONUYA_grafia normalizada.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 瑞典语计算词使用图数据集2_0_0

    2025年12月13日 30 202 59

    数据集概述 该数据集包含针对瑞典语的计算词使用图(Word Usage Graphs, WUGs),通过计算语义邻近模型自动标注使用对(边权重),可支持瑞典语词汇语义分析相关研究。 文件详解 文件名称:swewug_2.0.0.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含瑞典语计算词使用图数据,具体数据格式及处理代码可参考WUGsite获取...
    packageimg
  • CLICS_4跨语言共现数据库

    2025年12月13日 30 154 66

    数据集概述 本数据集为CLICS 4跨语言共现数据库(版本0.5),是一个改进后的跨语言共现研究数据库。该数据库聚焦于不同语言中词汇共现现象的收集与整理,为跨语言词汇关系、语义演变等研究提供结构化数据支持。 文件详解 文件名称:clics/clics4-v0.5.zip 文件格式:.zip(压缩包) 内容说明:包含CLICS...
    packageimg
  • 柏林柯尔克孜语语言资源数据集2018

    2025年12月13日 30 110 10

    数据集概述 本数据集是2018年夏季学期柏林洪堡大学“城市田野调查”硕士研讨课的成果,聚焦柏林的柯尔克孜语小众语言,包含四十个斯瓦迪士核心词汇表(ASJP词汇)、两段自由叙事及一段构造句录音等语言资料,为小众语言研究提供基础数据。 文件详解 该数据集包含十二个文件,具体说明如下: - 文档类文件(PDF格式): -...
    packageimg