多语言自然语言推理与跨语言推理数据集

多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-假设对,每个对中的两个句子之间的关系被分类为蕴含、中立或矛盾。该数据集适合用于训练、评估和微调跨语言推理能力的模型。 数据用途概述: 该数据集适用于跨语言自然语言推理、多语言文本分类、迁移学习和句子对分类等多种场景。研究人员可以训练和评估能够理解并从多语言文本中推断意义的模型;扩展NLI任务到多语言环境,实现自动的多语言文本分类;利用数据集的多语言特性对现有模型进行微调;开发能够确定不同语言中两个句子之间逻辑关系的模型。 举例: 例如,数据集中包含一个前提“猫坐在垫子上”和假设“猫在垫子上休息”,语言为英语,其分类标签为“蕴含”。这种多语言的成对句子可以帮助研究人员训练和测试跨语言的自然语言推理能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 32.98 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。