找到58个数据集

标签: 词汇分析

过滤结果
  • Dictionaria_Daakaka_Based_达卡卡语言词典研究完整数据

    2025年12月24日   

    数据集概述 该数据集为Daakaka语言词典数据,包含由Kilu Prince于2017年发布的《Daakaka dictionary》内容,是Dictionaria项目的一部分,为研究Daakaka语言提供基础词典资料。 文件详解 文件名称: dictionaria/daakaka-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Zalilex_俄语名词词形变化词典

    2025年12月24日   

    数据集概述 该数据集是基于Zaliznyak词典数字化版本提取的俄语名词词形变化词典,包含俄语名词的屈折变化信息,以压缩包形式存储,为俄语词汇形态学研究提供数据支持。 文件详解 文件名称:zalilex-v1.0.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 瓜拉尤语修订词典数据集2019

    2025年12月23日   

    数据集概述 该数据集为瓜拉尤语修订词典,由Alfred Hoeller编写,Danielsen、Swintha、Sell、Lena及Terhart、Lena于2019年发布,收录于Dictionaria 7,共1-3590页,提供瓜拉尤语的词汇修订内容。 文件详解 文件名称:dictionaria/guarayu-v1.2.zip...
    packageimg
  • 僧伽罗语梵语数字词汇表2_0_A至M

    2025年12月23日   

    数据集概述 本数据集为僧伽罗语梵语数字词汇表2.0版本,包含字母A至M对应的词汇内容,以PDF和ODS两种格式存储,为僧伽罗语梵语词汇研究提供结构化与文档化的数据支持。 文件详解 文件名称: Sinhala Prakrit, A-M - a, ā, ä, ǟ.pdf 文件格式: PDF 内容说明:...
    packageimg
  • Dictionaria_Hdi_Dictionary_Based_2017年Hdi语言词典完整数据

    2025年12月22日   

    数据集概述 该数据集为Hdi语言的词典数据,由Frajzyngier等学者于2017年发布,收录于Dictionaria 2,共1681页,提供Hdi语言词汇的系统记录,支持语言研究与文献参考。 文件详解 文件名称: dictionaria/hdi-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 阿拉瓦克语言多样性CLDF数据集2019

    2025年12月20日   

    数据集概述 本数据集为基于Chacon等人2019年研究的CLDF格式数据,内容围绕20世纪50年代录音资料中的阿拉瓦克语言多样性展开,聚焦里奥内格罗上游地区的语言记录与分析。 文件详解 文件名称: lexibank/chaconbaniwa-v2.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 新词研究_范式与句法特征

    2025年12月19日   

    数据集概述 本数据集围绕新词的范式与句法特征展开研究,包含一份相关主题的PDF文档,为新词的语言学特征分析提供基础资料。 文件详解 文件名称:Ismoilova Kamola Rafikovna.pdf 文件格式:PDF (.pdf) 内容说明:该文档为新词研究的相关文献,聚焦其范式与句法特征,具体内容需通过阅读文档获取 适用场景...
    packageimg
  • 词的语义结构中作为内涵成分的表达性作用

    2025年12月18日   

    数据集概述 本数据集包含一份关于词的语义结构的研究文档,核心内容围绕表达性作为词的内涵成分的角色展开,为相关语言学或语义学研究提供文献资料支持。 文件详解 文件名称: Navruzova Nigina Khamidovna.pdf 文件格式: PDF (.pdf) 文件内容: 该文档为PDF格式的研究文献,主题为“THE ROLE OF...
    packageimg
  • EDICTOR_3_交互式计算机辅助语言比较工具

    2025年12月9日   

    数据集概述 本数据集包含EDICTOR工具的最新稳定版本(3.1版),该工具是一款用于计算机辅助语言比较的交互式软件,可通过edictor.org/直接使用。 文件详解 文件名称: digling/edictor-v3.1.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含EDICTOR 3.1版软件的完整文件,具体文件结构需解压后查看...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日   

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • 贝纳方言调查数据集2013

    2025年12月14日   

    数据集概述 该数据集是基于2013年Mitterhofer的《贝纳方言调查》的CLDF格式数据集,聚焦贝纳方言词汇表分析,为研究贝纳方言提供结构化数据支持。 文件详解 文件名称:lexibank/mitterhoferbena-v3.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 乌兹别克语语言描述数据集

    2025年12月14日   

    数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 诺努亚语标准化书写数据库

    2025年12月14日   

    数据集概述 该数据集收录了对诺努亚语(noj,属于维托托语系)的8693条词汇与表达录音的转录内容,由四位母语者参与录制。转录内容采用该语言的标准化书写系统,并为每条转录分配了唯一标识符,便于语言分析工作引用。 文件详解 文件名称:NONUYA_grafia normalizada.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 瑞典语计算词使用图数据集2_0_0

    2025年12月13日   

    数据集概述 该数据集包含针对瑞典语的计算词使用图(Word Usage Graphs, WUGs),通过计算语义邻近模型自动标注使用对(边权重),可支持瑞典语词汇语义分析相关研究。 文件详解 文件名称:swewug_2.0.0.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含瑞典语计算词使用图数据,具体数据格式及处理代码可参考WUGsite获取...
    packageimg
  • CLICS_4跨语言共现数据库

    2025年12月13日   

    数据集概述 本数据集为CLICS 4跨语言共现数据库(版本0.5),是一个改进后的跨语言共现研究数据库。该数据库聚焦于不同语言中词汇共现现象的收集与整理,为跨语言词汇关系、语义演变等研究提供结构化数据支持。 文件详解 文件名称:clics/clics4-v0.5.zip 文件格式:.zip(压缩包) 内容说明:包含CLICS...
    packageimg
  • 柏林柯尔克孜语语言资源数据集2018

    2025年12月13日   

    数据集概述 本数据集是2018年夏季学期柏林洪堡大学“城市田野调查”硕士研讨课的成果,聚焦柏林的柯尔克孜语小众语言,包含四十个斯瓦迪士核心词汇表(ASJP词汇)、两段自由叙事及一段构造句录音等语言资料,为小众语言研究提供基础数据。 文件详解 该数据集包含十二个文件,具体说明如下: - 文档类文件(PDF格式): -...
    packageimg
  • 瑞士新冠疫情主流媒体词汇与命名实体分析数据集

    2025年12月12日   

    数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
    packageimg
  • 赫梯语言词库数字版测试版0_2数据集

    2025年12月12日   

    数据集概述 该数据集为赫梯语言词库数字版(TLHdig)测试版0.2的XML文档集合,是美因茨赫梯学门户网站的工具之一,包含标准化、可搜索、带注释的赫梯楔形文字手稿转写文本,反映百年来赫梯学研究成果。 文件详解 文件名称:TLHdig_0.2.0-beta.zip 文件格式:ZIP压缩包 内容说明:压缩包内包含TLHdig Beta...
    packageimg
  • 班图语族词汇多样性个体视角研究论文补充材料

    2025年12月12日   

    数据集概述 本数据集为论文《Bantoid lexical diversity from an individual-based perspective》的补充材料,包含支持该研究的相关数据与代码,以压缩包形式提供,为理解班图语族词汇多样性的个体视角分析提供辅助资料。 文件详解 文件名称: GoodEtAl-...
    packageimg
  • 大众媒体中人群事故报道数据集

    2025年12月10日   

    数据集概述 该数据集包含对人群事故相关新闻报道语料库的分析结果,按类别组织文件以支持在线可视化和离线分析。内容涵盖新闻报道源信息、维基百科语料库、词汇分析结果及情感分析数据,为研究媒体对人群事故的呈现提供多维度支持。 文件详解 分类0(0_data_all.zip):所有文件的结构化压缩包,便于直接下载和分析,包含词汇分析、情感分析等全部数据。...
    packageimg