NNSeval_Based_非母语者词汇简化评估数据集

数据集概述

本数据集基于针对非母语者的词汇复杂度用户研究构建,包含400名非母语者对维基百科、LSeval和LexMTurk来源句子中内容词的理解度标注结果,经筛选优化后形成NNSeval数据集,可用于评估词汇简化系统对非母语者的适用性。

文件详解

  • 文件名称:NNSeval.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包包含经处理的词汇简化评估实例数据,原始数据涵盖目标词、候选替代词、标注者理解度判断等信息,最终数据集含239个符合非母语者复杂词标注标准的实例。

数据来源

用户研究及LSeval、LexMTurk数据集

适用场景

  • 词汇简化系统评估: 用于测试词汇简化系统对非母语者的有效性,验证候选替代词的易懂性。
  • 非母语者语言认知研究: 分析非母语者对不同词性内容词的理解难度分布特征。
  • 自然语言处理数据集优化: 为构建针对非母语用户的语言资源提供标注依据。
  • 二语习得研究: 探究非母语者词汇理解的影响因素,支持语言教学材料的难度适配。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.03 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。