找到6个数据集

分类: 公开数据 标签: 语言建模

过滤结果
  • 基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017

    2025年12月21日 30 209 28

    数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
    packageimg
  • Transformer与扩散模型协同集成的统一理论框架

    2025年12月16日 30 139 69

    数据集概述 本数据集为一篇学术论文,提出了一种用于Transformer与扩散模型协同集成的统一理论框架。通过统一表示和广义动力学方程建立两者的对应关系,包含数学公式、注意力机制创新及理论分析,为结合两种范式优势的新型AI模型奠定基础。 文件详解 文件名称: Transformer_and_diffusion.pdf 文件格式: PDF (.pdf)...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 49 24

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • 印欧语系内部语言快速辐射补充材料数据集

    2025年12月13日 30 54 51

    数据集概述 本数据集是论文《印欧语系内部语言的快速辐射:印欧语词汇统计的先进方法》的补充材料,包含词汇表、语言学注释文档及系统发育树相关技术文件,支持实验可重复性。 文件详解 数据集包含3个文件,具体说明如下: - Kassian-et-al_2021_IE_phylogeny_Supplement-...
    packageimg
  • Wichmann_2025_ASJP_Database_Based_语言比较研究CLDF完整数据

    2025年12月11日 30 178 158

    数据集概述 本数据集是基于Wichmann等人2025年发布的"ASJP Database"第21版转换而来的CLDF格式数据集,为语言比较研究提供标准化数据支持。 文件详解 文件名称: lexibank/asjp-v21.zip 文件格式: ZIP压缩包(.zip) 内容说明: 包含ASJP...
    packageimg
  • Skirgård_Grambank_Based_语言语法特征分析完整数据

    2025年12月7日 30 23 21

    数据集概述 本数据集为Grambank v1.0版本,是一个与语言语法特征相关的数据库。相关研究论文将发表于《Science Advances》,旨在揭示谱系约束对语言多样性的重要性,并强调语言流失的影响。 文件详解 文件名称: grambank/grambank-v1.0.3.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg