找到1个数据集

标签: 噪声姓名

过滤结果
  • NSDGen生成噪声人名聚类算法测试数据集

    2025年11月29日 30 49 32

    数据集概述 本数据集包含30个CSV文件,专门用于评估聚类算法在模糊姓名匹配、记录链接和权威控制等场景下的性能。数据通过NSDGen噪声字符串生成工具创建,模拟真实世界中姓名字符串常见的拼写错误,如字符插入、删除、替换和调换等。每个数据集通过引入QWERTY键盘距离图来生成噪声,将原始精确副本转换为具有观察值的分组数据。 文件详解 数据文件(Data...
    packageimg