找到2个数据集

标签: 母语者标注

过滤结果
  • SherlockBox_RuNeg_Based_俄语否定标注数据

    2026年1月28日 30 89 19

    数据集概述 本数据集为俄语否定标注数据集,包含阿瑟·柯南·道尔《硬纸盒子》俄语译文的120个含否定句,标注了否定触发词和否定范围。数据由母语者用Prodigy工具标注,以JSON和TXT两种格式呈现,用于自然语言处理中否定分析研究。 文件详解 文件1:RUS.json 文件格式:JSON...
    packageimg
  • 名词复合词组合性数据集

    2025年12月6日 30 146 115

    数据集概述 该数据集包含英语、法语和巴西葡萄牙语三种语言的名词复合词组合性评分数据,以及葡萄牙语复合词的词汇替换扩展标注。评分由母语者完成,涵盖整体及各构词成分的组合性;扩展数据包含词汇替换候选及分类,支持多语言词汇语义研究。 文件详解 该数据集包含压缩包和说明文档,具体如下: - 组合性评分数据集压缩包: - comp-datasets-...
    packageimg