欧洲信用卡欺诈检测交易数据集-2015年6月25日
数据来源:互联网公开数据
标签:信用卡,欺诈检测,交易数据,欧洲,机器学习,大数据,PCA,安全,金融,研究
数据概述:
本数据集包含2013年9月欧洲信用卡持有者的交易记录,涵盖两天内发生的284,807笔交易,其中492笔被标记为欺诈交易。该数据集高度不平衡,欺诈交易仅占所有交易的0.172%。
数据集仅包含数值型输入变量,这些变量是通过主成分分析(PCA)转换得到的。由于保密原因,无法提供原始特征和更多背景信息。特征V1, V2, … V28是从PCA中获得的主要成分,时间(Time)和金额(Amount)两个特征未经过PCA转换。时间特征表示每笔交易与数据集中第一笔交易之间的时间间隔(以秒为单位),金额特征表示交易金额,可用于依赖示例的成本敏感学习。类别(Class)是响应变量,当交易为欺诈时取值为1,否则为0。
该数据集由Worldline和布鲁塞尔自由大学(Université Libre de Bruxelles)的机器学习小组(mlg.ulb.ac.be)在大数据挖掘和欺诈检测研究合作中收集和分析。更多相关信息可在以下网址找到:http://mlg.ulb.ac.be/BruFence 和 http://mlg.ulb.ac.be/ARTML。
数据用途概述:
该数据集适用于信用卡欺诈检测算法的研究和开发、机器学习模型的训练与评估、大数据分析技能的培养。研究人员可以利用此数据集进行欺诈检测技术的创新;金融机构可以利用此数据集优化风险控制策略;教育机构可以将其用于教学和学生项目。此数据集为相关领域的研究和应用提供了宝贵的数据资源。