尼泊尔语句子相似度基准数据集1963-2021

尼泊尔语句子相似度基准数据集1963-2021 数据来源:互联网公开数据 标签:尼泊尔语,句子相似度,自然语言处理,机器翻译,同义句检测,语义搜索 数据概述: 本数据集是尼泊尔语版的句子文本相似性基准(STS-B),源自STS-B多语言翻译语料库。数据集包含成对的句子,并标注了相似度分数,以表明这两句话在语义上的相似程度。每个句子对被赋予0到5的相似度分数,其中0表示没有相似性,5表示完全的语义等价。该数据集为开发和评估专注于理解与测量尼泊尔语句子相似性的自然语言处理(NLP)模型提供了宝贵资源。 数据用途概述: 该数据集适用于多种自然语言处理应用场景,包括机器翻译、同义句检测和语义搜索等。研究人员和开发者可以利用此数据集来提升尼泊尔语语言技术的发展水平,促进相关技术在尼泊尔语领域的应用与创新。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.32 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。