XQuAD

XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190 个问答对的子集,以及它们的十种语言的专业翻译:西班牙语、德语、希腊语、俄语、土耳其语、阿拉伯语、越南语、泰语、汉语和印地语。因此,数据集在 11 种语言中完全平行。

packageimg

数据与资源

附加信息

字段
数据集大小 28.89 MiB
最后更新 2025年2月11日
创建于 2024年11月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。