找到3个数据集

标签: 相似度评分

过滤结果
  • 加泰罗尼亚语语义文本相似度基准数据集1_0_2

    2025年12月9日 30 125 69

    数据集概述 该数据集是用于评估加泰罗尼亚语语义文本相似度(STS)的基准语料库,包含三千余对人工标注的句子对,标注遵循SemEval挑战指南,基于0到5分的相似度评分标准,为语义相似度模型的构建与评估提供支持。 文件详解 文件名称:STS-ca_v.1.0.2.zip 文件格式:ZIP压缩包...
    packageimg
  • 软件相似度数据集

    2025年12月4日 30 190 137

    数据集概述 该数据集包含软件相似度学习的后处理数据,涉及软件功能的嵌入表示、软件信息提取结果及软件对的相似度评分数据,支持软件相似度相关研究与分析。 文件详解 数据压缩包: data.zip:ZIP格式压缩包,可能包含软件功能嵌入与信息提取的原始或处理后数据,如嵌入的软件图表示、函数名称及对应调用函数和函数令牌的信息。 相似度评分文件:...
    packageimg
  • 数据3000文本恢复挑战提示数据集

    2025年4月15日 30 79 21

    数据3000文本恢复挑战提示数据集 数据来源:互联网公开数据 标签:文本恢复,提示生成,创造力,文本处理,专业设置,维基百科,相似度评分 数据概述:...
    packageimg