"英文标题:Global Advertising Traffic Anti-Fraud Identification and Risk Assessment Dataset
数据集概述
用于识别广告投放平台流量造假行为并评估风险等级的专业数据集,涵盖广告投放全链路的流量行为特征、环境属性及造假标识信息。数据覆盖全球主要广告投放平台,包含合规流量与已知造假流量的对比样本,颗粒度精确至单广告位、单请求层级,支持多维度造假特征的关联分析。数据集按广告投放周期组织,特征字段基于广告业反欺诈实践框架设计,标注规则符合行业通用风险评估标准。该数据集为广告主、平台方及第三方监测机构提供了识别流量造假的核心依据,可支撑造假行为模式总结、风险等级量化及反欺诈模型训练等工作,有助于降低虚假流量对广告投放效果的影响。
字段详情
数据集包含以下核心字段:
- ad_slot_id:广告位标识符,指广告投放的具体展示位置编码,唯一标识单广告位资源
- traffic_source_attr:流量来源属性,指触发广告请求的用户终端环境特征集合(含IP归属地、设备型号、浏览器版本等维度)
- user_behavior_seq:用户行为序列,指广告请求前72小时内用户的网站/APP访问行为时间序列数据
- fake_traffic_flag:造假流量标识,取值为0(合规)或1(造假),指基于行业反欺诈规则判定的流量真实性标签
- risk_level_score:风险等级得分,单位为分(0-100),指基于多特征加权计算的流量风险量化指标
适用场景
- 广告主评估投放平台流量质量,优化广告预算分配策略
- 广告投放平台构建实时流量反欺诈系统,拦截造假请求
- 第三方广告监测机构开展行业流量造假率调研与报告撰写
- 人工智能企业训练广告流量造假识别模型并验证效果
- 监管部门监测广告市场流量合规性,制定反欺诈行业规范"