土耳其自然语言推理数据集

土耳其自然语言推理数据集 数据来源:互联网公开数据
标签:自然语言推理,土耳其语,NLI,机器学习,自然语言处理,文本分类,跨语言推理
数据概述:
本数据集包含两个子集(SNLI-TR和MNLI-TR),提供了经过精心筛选和翻译的土耳其语自然语言推理数据,旨在支持自然语言处理和机器学习领域的研究。数据集中的句子对来源于英语SNLI和MNLI数据集的土耳其语翻译,涵盖多种语言推理任务,如句子蕴含、矛盾检测和中立判断等。数据集分为训练集、验证集和测试集,适用于不同研究阶段的需求。

数据用途概述:
该数据集适用于多种自然语言处理任务,包括但不限于自然语言推理、机器翻译质量评估、跨语言模型迁移学习等。研究人员可以利用此数据集开发土耳其语的文本分类模型、问答系统或聊天机器人;同时,数据集也支持探索跨语言模型的泛化能力,帮助理解不同语言在自然语言推理任务中的表现差异。此外,该数据集为土耳其语的自然语言处理研究提供了宝贵的基础资源,适用于学术研究、技术创新和工业应用等多种场景。

字段定义:
1. premise(前提):包含土耳其语句子,来源于英语SNLI和MNLI数据集的翻译。
2. hypothesis(假设):包含土耳其语句子,来源于英语SNLI和MNLI数据集的翻译。
3. label(标签):表示两个句子之间的关系,取值为“entailment”(蕴含)、“contradiction”(矛盾)或“neutral”(中立)。

数据集为研究人员和开发者提供了标准化的土耳其语自然语言推理基准,助力推动土耳其语及其跨语言自然语言处理技术的发展。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 48.66 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。