信用卡欺诈检测交易数据集-2000至2022年
数据来源:互联网公开数据
标签:信用卡欺诈,交易记录,消费者行为,数据检测,金融安全,个人信息,地理数据
数据概述:
本数据集包含信用卡交易记录,包括持卡人(如姓名、性别、职业和地址)和交易发生商家的相关信息,以及持卡人和商家的地理位置数据(纬度和经度)。数据集中包含一个"is_fraud"标签,用于标识每笔交易是否被标记为欺诈交易(1表示欺诈,0表示非欺诈)。
数据集适用于构建欺诈检测模型或分析消费者行为。数据包含以下字段:
trans_date_trans_time:交易发生的日期和时间(格式:DD-MM-YYYY HH:MM)。
cc_num:用于交易的信用卡号码。
merchant:交易发生的商家名称。
category:交易类别,表明商家的类型(例如:杂货、餐馆、misc_net)。
amt:交易涉及的金额。
first:持卡人的名字。
last:持卡人的姓氏。
gender:持卡人的性别(M/F)。
street:持卡人的街道地址。
city:持卡人的城市地址。
state:持卡人的州地址。
zip:持卡人的邮政编码。
lat:持卡人地址的纬度。
long:持卡人地址的经度。
city_pop:持卡人所在城市的总人口。
job:持卡人的工作/职业。
dob:持卡人的出生日期。
trans_num:每笔交易的唯一标识符。
unix_time:交易的时间戳,以Unix格式表示。
merch_lat:商家位置的纬度。
merch_long:商家位置的经度。
is_fraud:一个二进制标签,表示交易是否为欺诈交易(1表示欺诈,0表示非欺诈)。
merch_zipcode:商家位置的邮政编码。
数据用途概述:
该数据集适用于信用卡欺诈检测模型的构建、消费者行为分析、金融安全研究等场景。研究人员可以利用此数据识别欺诈模式,金融机构可利用此数据提高欺诈检测能力;政策制定者可依据数据评估金融安全状况,制定相关政策。此外,数据集也适用于教育与培训,帮助学习者了解信用卡欺诈的检测方法和消费行为分析的基本概念。