韩国自然语言推理数据集1963-2021-thedevastator
数据来源:互联网公开数据
标签:KOR_NLI,自然语言推理,韩语,文本分析,机器学习,自然语言处理,推理模型
数据概述:
本数据集包含了一个全面的韩语自然语言理解数据集,涵盖了句子之间的蕴含、矛盾和中立关系,由人工标注的标签组成。该数据集旨在帮助科学家构建使用自然语言处理和推理的预测模型,以理解文本的潜在含义。数据集包括SNLI训练集、XNLI测试集、XNLI验证集和Multi-NLI训练集,为用户提供广泛的数据来探索自然语言推理的复杂性。每个数据集都包含详细的前提和假设,并附有预设的标签,说明它们之间的关系,从而为希望进入这一领域的研究者提供了宝贵的资源。
数据用途概述:
该数据集适用于多种研究和应用领域,包括自动评估写作,上下文感知系统开发,文档分类和分类等。具体应用包括开发自动评估写作中自然语言元素(如语法、风格和内容)的算法,创建能够更好地理解用户查询上下文的智能系统,以及通过分配标签来分类文档,说明它们是否相互蕴含、矛盾或中立。
字段定义:
文件:snli_train.csv
- premise:句子对中的第一个句子。(字符串)
- hypothesis:句子对中的第二个句子。(字符串)
- label:指示两个句子之间是蕴含、矛盾还是中立。(字符串)
文件:xnli_test.csv
- premise:句子对中的第一个句子。(字符串)
- hypothesis:句子对中的第二个句子。(字符串)
- label:指示两个句子之间是蕴含、矛盾还是中立。(字符串)
文件:xnli_validation.csv
- premise:句子对中的第一个句子。(字符串)
- hypothesis:句子对中的第二个句子。(字符串)
- label:指示两个句子之间是蕴含、矛盾还是中立。(字符串)
文件:multi_nli_train.csv
- premise:句子对中的第一个句子。(字符串)
- hypothesis:句子对中的第二个句子。(字符串)
- label:指示两个句子之间是蕴含、矛盾还是中立。(字符串)
致谢:
如果您在研究中使用此数据集,请引用原始作者。
数据来源:Huggingface Hub
许可:
许可:CC0 1.0 通用公共领域贡献 - 没有版权
您可以复制、修改、分发和表演作品,即使用于商业目的,也不需要请求许可。查看其他信息。