西班牙语方言词汇使用图数据集

数据集概述

该数据集包含西班牙语的方言词汇使用图(Word Usage Graphs, WUGs),记录了西班牙及古巴、哥伦比亚等西班牙语变体中词汇的使用差异。数据标注了词汇使用的方言分组与时间中点(约2000-2014年),并将噪声使用标注为聚类标签-1,为研究西班牙语词汇语义的方言变异提供支持。

文件详解

  • 文件名称: diawug.zip
  • 文件格式: ZIP (.zip)
  • 内容说明: 压缩包内包含西班牙语方言词汇使用图数据,标注字段包括:
  • 词汇使用的时间中点(约2000-2014年)
  • 方言分组编码(0=西班牙,1=古巴,2=哥伦比亚,3=阿根廷,4=秘鲁,6=委内瑞拉)
  • 噪声使用聚类标签(-1)

适用场景

  • 西班牙语方言词汇研究:分析不同西班牙语变体中词汇语义的差异与演变
  • 计算语言学研究:构建方言词汇变异的计算模型或语义表示
  • 语言资源开发:为西班牙语方言标注工具或词典编纂提供实证数据
  • 跨语言对比研究:探究罗曼语族词汇语义变异的共性与特性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.99 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。