欺诈与合法在线商店数据集

数据集概述

该数据集包含欺诈与合法在线商店的平衡数据,共一千一百四十条记录,其中五百七十九条为欺诈商店数据,五百六十一条为合法商店数据。每条记录涵盖URL特征、支付方式、证书信息、域名状态及平台评价等字段,为在线商店欺诈识别研究提供结构化数据支持。

文件详解

  • 文件名称: Fraudulent_online_shops_dataset.csv
  • 文件格式: CSV(.csv)
  • 核心字段:
  • Online shop URL: 在线商店网址
  • Label: 商店类型(legitimate/合法、fraudulent/欺诈)
  • Domain length: 域名长度(字符数)
  • Top domain length: 顶级域名长度(字符数)
  • Presence of prefix 'www': 是否含www前缀(0-否、1-是)
  • Number of digits/letters/dots/hyphens in URL: URL中的数字、字母、点、连字符数量
  • Payment-related fields: 信用卡、货到付款等支付方式存在性(0-否、1-是)
  • SSL certificate info: SSL证书发行方、过期日期、机构ID等
  • Domain status: 域名注册日期、是否为新域名(注册≤四百天)
  • Review info: TrustPilot评价存在性及评分

适用场景

  • 电子商务安全研究: 用于构建在线商店欺诈识别模型
  • 网络安全分析: 分析欺诈商店的URL特征、域名及证书规律
  • 支付安全研究: 探究支付方式与商店合法性的关联
  • 消费者保护应用: 开发在线购物风险预警工具
  • 数据挖掘教学: 作为分类算法(如决策树、随机森林)的训练数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.03 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。