印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy

印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy 数据来源:互联网公开数据 标签:NLI,自然语言推理,跨语言,印度尼西亚,爪哇语,Ngoko,文本分析,数据集

数据概述: 本数据集包含印尼语的前提句子和爪哇语“Ngoko”(非正式语)的假设句子,旨在用于跨语言自然语言推理任务。数据集涵盖了不同主题的句子对,有助于研究不同语言之间的语义关系和逻辑推理能力。

数据集中的每条记录由两部分组成: - 前提(Premise):使用印尼语表达的基础陈述或前提条件。 - 假设(Hypothesis):使用爪哇语“Ngoko”表达的需要推理的结论或推测。

数据集采用制表符(\t)作为字段分隔符,适合使用Pandas库的read_csv函数进行读取。

数据用途概述: 该数据集适用于自然语言处理研究、跨语言文本分析、机器翻译模型评估、语言模型训练等多种应用场景。研究人员可以利用此数据集开发和评估跨语言推理算法;语言学家可以研究不同语言之间的语义对齐和转换;教育者可以使用数据集进行语言学教学和研究。此外,数据集也有助于开发支持多语言的智能助手和对话系统。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.07 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。