数据集概述
该数据集为合成数据,基于银行客户与在线连接IP地址的真实关系数据生成,用于构建银行社交图谱的一部分。数据集包含超过一百万条记录,由CAIXA和IBM通过IBM TDF工具设计数据生成规则并迭代优化,用于测试MVP。
文件详解
- 04_SyntheticIPAddressCAIXA_I-BiDaaS_WP2_D2.1_v0.1_metadata.pdf:PDF格式,可能包含数据集的元数据说明,如生成规则、字段定义等背景信息
- 04_SyntheticIPAddressCAIXA_I-BiDaaS_WP2_D2.1_v0.1.csv:CSV格式,核心数据文件,包含字段:
- fk_numperso:客户标识
- ip_terminal:终端IP地址
- pk_tsinsercion:插入时间戳
- fk_cod_operacion:操作编码
- pk_cod_estado_op:操作状态编码
数据来源
CAIXA和IBM
适用场景
- 银行社交图谱构建:分析客户间基于IP地址的关联关系
- 金融科技产品测试:为MVP提供大规模合成数据支持
- 客户行为分析:研究客户在线连接的IP地址特征与操作行为的关系
- 数据隐私研究:探索基于真实数据生成合成隐私保护数据的方法与应用