-
French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集
2026年1月17日 30 180 86
数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
-
PAN14文本对齐原创性测试语料库2014
2025年12月9日 30 74 36
数据集概述 本数据集为PAN14任务提供的测试语料库,包含文档对数据,其中部分文档可能存在经自动混淆处理的复用文本,用于研究文本原创性检测及对齐问题。 文件详解 文件名称: pan14-text-alignment-test-corpus3-2014-05-14.zip 文件格式: ZIP压缩包 内容说明:...



