含噪合成交易数据集

数据集概述

该数据集包含五万条含噪合成交易记录,涉及十种交易项目。所有字段为字符串类型,存在“True”“False”的大小写或拼写变体等噪声,需预处理后使用。

文件详解

  • 文件名称: synthetic_transactions_noisy.csv
  • 文件格式: CSV
  • 字段映射: 包含Bread、Butter、Cereal、Cheese、Coffee、Eggs、Juice、Milk、Tea、Yogurt十个字段,每个字段记录对应交易项目是否存在,因噪声存在四种唯一值(如TRUE、True、FALSE、False等变体)

适用场景

  • 数据清洗方法验证: 测试噪声数据预处理算法效果
  • 异常检测研究: 识别交易数据中的异常值或拼写变体
  • 数据质量评估: 分析含噪数据对后续分析结果的影响
  • 特征工程实践: 探索如何将含噪分类数据转换为标准化特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.16 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。