信用卡欺诈检测交易数据集-2011

信用卡欺诈检测交易数据集-2011 数据来源:互联网公开数据 标签:信用卡欺诈,金融交易,数据安全,机器学习,PCA,时间序列,金额,数据平衡,金融风险

数据概述: 本数据集包含了在两天内发生的284,807笔交易记录,其中包含492笔欺诈交易。该数据集高度不平衡,欺诈交易(正类)仅占总交易量的0.172%。

数据集仅包含数值型输入变量,这些变量是通过主成分分析(PCA)转换得到的。由于保密原因,无法提供原始特征和更多关于数据的背景信息。特征V1, V2, … V28是通过PCA获得的主成分,未进行PCA变换的特征仅有'Time'(时间)和'Amount'(金额)。'Time'特征表示每笔交易与数据集中第一笔交易之间经过的秒数,而'Amount'特征表示交易金额,可用于依赖于样本的代价敏感学习。'Class'特征是响应变量,当交易为欺诈时取值为1,否则为0。

数据用途概述: 该数据集适用于信用卡欺诈检测、金融交易分析、机器学习模型评估等多种场景。研究人员可以利用此数据集进行欺诈检测算法的开发和验证;金融机构可以使用该数据集优化欺诈识别系统,降低风险;教育机构亦可用作机器学习和数据科学教学的案例数据。此外,数据集还适合用于研究数据不平衡问题及其解决方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 65.6 MiB
最后更新 2025年4月20日
创建于 2025年4月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。