信用卡欺诈交易检测数据集-samkowitt

信用卡欺诈交易检测数据集-samkowitt 数据来源:互联网公开数据 标签:信用卡欺诈,交易数据,金融安全,数据建模,机器学习,匿名化处理

数据概述: 本数据集包含超过30万条匿名化的交易记录,旨在用于构建预测潜在欺诈交易的模型。交易记录中的变量经过匿名化处理,以保护消费者信息,但这些变量仍然代表了诸如账户持有时间等字段。每行数据代表一笔用户的交易。数据集具有较高的欺诈率,约为0.1%,因此数据分布极不平衡。

数据集中包含的变量如下: 时间:交易发生的时间 匿名变量(30个):一系列匿名化处理的变量,代表交易的各种特征 金额:交易涉及的金额 类别:交易是否为欺诈交易的分类标识(0表示非欺诈,1表示欺诈)

此数据集不仅包含行和列,还提供了通过分类器构建预测模型的可能性,以识别潜在的欺诈交易。数据集中的交易记录涵盖了多个时间点,具体时间范围未详细说明,但适用于构建和评估反欺诈模型。

致谢: 本数据集的构建和发布离不开相关研究者和机构的支持和贡献。感谢所有为此项目提供帮助和数据的个人及团队。

灵感: 本数据集将面向全球最大的数据科学社区,期待通过该数据集回答以下问题:如何提高欺诈检测的准确性?哪些特征在预测欺诈交易中最为重要?如何在不平衡数据集中优化模型性能?

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 65.6 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。