数据集

韩国自然语言推理数据集1963-2021-thedevastator

韩国自然语言推理数据集1963-2021-thedevastator 数据来源：互联网公开数据标签：KOR_NLI,自然语言推理,韩语,文本分析,机器学习,自然语言处理,推理模型

数据概述：本数据集包含了一个全面的韩语自然语言理解数据集，涵盖了句子之间的蕴含、矛盾和中立关系，由人工标注的标签组成。该数据集旨在帮助科学家构建使用自然语言处理和推理的预测模型，以理解文本的潜在含义。数据集包括SNLI训练集、XNLI测试集、XNLI验证集和Multi-NLI训练集，为用户提供广泛的数据来探索自然语言推理的复杂性。每个数据集都包含详细的前提和假设，并附有预设的标签，说明它们之间的关系，从而为希望进入这一领域的研究者提供了宝贵的资源。

数据用途概述：该数据集适用于多种研究和应用领域，包括自动评估写作，上下文感知系统开发，文档分类和分类等。具体应用包括开发自动评估写作中自然语言元素（如语法、风格和内容）的算法，创建能够更好地理解用户查询上下文的智能系统，以及通过分配标签来分类文档，说明它们是否相互蕴含、矛盾或中立。

字段定义：文件：snli_train.csv - premise：句子对中的第一个句子。（字符串） - hypothesis：句子对中的第二个句子。（字符串） - label：指示两个句子之间是蕴含、矛盾还是中立。（字符串）

文件：xnli_test.csv - premise：句子对中的第一个句子。（字符串） - hypothesis：句子对中的第二个句子。（字符串） - label：指示两个句子之间是蕴含、矛盾还是中立。（字符串）

文件：xnli_validation.csv - premise：句子对中的第一个句子。（字符串） - hypothesis：句子对中的第二个句子。（字符串） - label：指示两个句子之间是蕴含、矛盾还是中立。（字符串）

文件：multi_nli_train.csv - premise：句子对中的第一个句子。（字符串） - hypothesis：句子对中的第二个句子。（字符串） - label：指示两个句子之间是蕴含、矛盾还是中立。（字符串）

致谢：如果您在研究中使用此数据集，请引用原始作者。数据来源：Huggingface Hub

许可：许可：CC0 1.0 通用公共领域贡献 - 没有版权您可以复制、修改、分发和表演作品，即使用于商业目的，也不需要请求许可。查看其他信息。

数据与资源

versions_20250411024638.zipZIP
39.47 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	39.47 MiB
最后更新	2025年4月23日
创建于	2025年4月23日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

韩国自然语言推理数据集1963-2021-thedevastator

数据与资源

附加信息

注册成功！