词语类比测试数据集-julianschelb

词语类比测试数据集-julianschelb 数据来源:互联网公开数据 标签:自然语言处理,词向量,类比,语义,语言模型,测试集,词汇,认知 数据概述: 本数据集旨在测试语言模型在词语类比任务中的表现。数据集由四词一组的词语构成,每组词语都遵循“A之于B如同C之于D”的类比关系。例如,"伯尔尼之于瑞士如同东京之于日本"或者"老鼠之于老鼠们如同电脑之于电脑们"。数据来源于GitHub上的公开资源。 数据用途概述: 该数据集主要用于评估和训练自然语言处理模型,特别是词向量模型。研究人员可以利用此数据集测试模型捕捉词语语义关系的能力,例如,判断模型是否能够理解“首都-国家”或“单数-复数”等关系。此外,该数据集也可用于语言模型的调优,以及在教育领域中,帮助学生理解词语之间的语义关联。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.18 MiB
最后更新 2025年4月24日
创建于 2025年4月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。