数据集

词语类比测试数据集-julianschelb

词语类比测试数据集-julianschelb 数据来源：互联网公开数据标签：自然语言处理,词向量,类比,语义,语言模型,测试集,词汇,认知数据概述：本数据集旨在测试语言模型在词语类比任务中的表现。数据集由四词一组的词语构成，每组词语都遵循“A之于B如同C之于D”的类比关系。例如，"伯尔尼之于瑞士如同东京之于日本"或者"老鼠之于老鼠们如同电脑之于电脑们"。数据来源于GitHub上的公开资源。数据用途概述：该数据集主要用于评估和训练自然语言处理模型，特别是词向量模型。研究人员可以利用此数据集测试模型捕捉词语语义关系的能力，例如，判断模型是否能够理解“首都-国家”或“单数-复数”等关系。此外，该数据集也可用于语言模型的调优，以及在教育领域中，帮助学生理解词语之间的语义关联。

数据与资源

versions_20250411172043.zipZIP
0.18 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.18 MiB
最后更新	2025年4月24日
创建于	2025年4月24日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

词语类比测试数据集-julianschelb

数据与资源

附加信息

注册成功！