西班牙语方言基准数据集

数据集概述

本数据集聚焦西班牙语方言差异,通过31道选择题评估大型语言模型(LLMs)对不同西班牙语方言的区分与使用能力,旨在解决传统基准忽略方言细微差别的问题,为分析模型方言偏见提供支持。

文件详解

  • 文件名称: example_of_results.zip:压缩文件,可能包含数据集结果示例或相关说明文档
  • 文件名称: dataset.zip:压缩文件,包含数据集核心内容,如31道方言选择题及对应选项(反映半岛、智利、安的列斯、墨西哥、拉普拉塔等西班牙语方言差异)

适用场景

  • 自然语言处理研究:评估LLMs对西班牙语方言的识别与处理能力
  • 方言语言学分析:研究西班牙语不同方言的词汇、语法差异
  • 模型偏见检测:分析LLMs在多方言场景下的性能偏差
  • 语言教育应用:为西班牙语方言教学提供差异化案例参考
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.6 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。