美国信用卡欺诈检测数据集-2013年9月-asrakhan1039

美国信用卡欺诈检测数据集-2013年9月-asrakhan1039 数据来源:互联网公开数据 标签:信用卡,欺诈检测,交易记录,PCA,数据不平衡,机器学习,金融安全,美国,欧洲卡持卡人

数据概述: 本数据集包含2013年9月欧洲卡持卡人在两天内的信用卡交易记录,总共有284,807笔交易,其中492笔为欺诈交易。数据集高度不平衡,欺诈交易占总交易量的0.172%。数据集中的特征均为数值型,是通过主成分分析(PCA)转换得到的。除了“时间”和“金额”两个特征未经过PCA变换外,其余特征V1至V28均为PCA的主成分。特征“时间”表示每笔交易与数据集中第一笔交易之间经过的秒数,特征“金额”表示交易金额,可用于依赖于实例的成本敏感学习。特征“类别”为响应变量,当交易为欺诈时取值为1,否则为0。

数据用途概述: 该数据集适用于信用卡欺诈检测模型的构建与评估、机器学习技术的研究、金融安全领域的问题分析等场景。研究人员可以利用该数据集开发和测试欺诈检测算法,评估模型性能;金融机构可以使用此数据集优化其欺诈检测系统,提升安全性;教育机构可以采用此数据集进行机器学习和数据科学的教学。由于数据集存在严重的类别不平衡问题,建议使用精确率-召回率曲线下的面积(AUPRC)来衡量模型的准确性,而不应使用混淆矩阵的准确性指标。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 65.6 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。