孟加拉语同义句识别基准语料库数据集

孟加拉语同义句识别基准语料库数据集 数据来源:互联网公开数据 标签:同义句检测,孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言模型评估 数据概述: 本数据集是一个用于孟加拉语同义句识别的基准语料库,收录了8,787对人工标注的句子对,这些句子对来源于23家报纸头版在四个类别中的内容。该数据集旨在为孟加拉语同义句检测的研究提供全面的基准。 数据用途概述: 该数据集适用于同义句检测模型的训练与评估、语言处理研究、文本分析、机器学习算法开发等多个场景。研究人员可以利用此数据集评估不同模型在孟加拉语同义句检测任务上的性能,包括传统相似度度量方法、语言学特征提取以及预训练和微调的BERT模型。此外,该数据集还适合用于比较不同模型(如GPT-3.5 turbo)在零样本和少量样本条件下的表现,帮助识别模型在同义句检测任务中的优势与不足。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.24 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。