-
SemEval_2022多语言新闻文章相似度数据集
2025年12月20日 30 76 48
数据集概述 该数据集包含2020年上半年的多语言新闻文章对,标注了地理焦点、命名实体、时间、叙事框架、整体内容、写作风格及语气共七个维度的相似度,为新闻文本相似度研究提供标注数据支持。 文件详解 数据文件(CSV格式): final_eval_data.csv:评估数据集,包含文章对语言、URL、互联网档案馆链接及GEO、ENT等七个相似度标注字段...
-
dinG语料库AMR标注数据集
2025年12月19日 30 79 47
数据集概述 本数据集是采用抽象意义表示(AMR)标注的dinG语料库,dinG语料库由Boritchev和Amblard于2022年提出,包含语料库的数据声明和标注指南,为语义分析相关研究提供标注资源。 文件详解 文件名称: ding-01.zip 文件格式: ZIP压缩包(.zip) 内容说明:...



