-
西班牙语方言基准数据集
2025年12月19日 30 76 21
数据集概述 本数据集聚焦西班牙语方言差异,通过31道选择题评估大型语言模型(LLMs)对不同西班牙语方言的区分与使用能力,旨在解决传统基准忽略方言细微差别的问题,为分析模型方言偏见提供支持。 文件详解 文件名称: example_of_results.zip:压缩文件,可能包含数据集结果示例或相关说明文档 文件名称:...
-
西班牙语方言词汇使用图数据集
2025年12月8日 30 196 32
数据集概述 该数据集包含西班牙语的方言词汇使用图(Word Usage Graphs, WUGs),记录了西班牙及古巴、哥伦比亚等西班牙语变体中词汇的使用差异。数据标注了词汇使用的方言分组与时间中点(约2000-2014年),并将噪声使用标注为聚类标签-1,为研究西班牙语词汇语义的方言变异提供支持。 文件详解 文件名称: diawug.zip...



