"英文标题:Insurance Fraud Detection Algorithm Validation Dataset
数据集概述
聚焦保险欺诈识别领域的算法开发与验证需求,包含欺诈识别算法的核心参数配置、实验场景设定、样本标签与验证结果等结构化信息。
数据覆盖多类型保险欺诈场景的算法训练与测试环节,包含算法模型的关键调参指标、欺诈样本特征权重、实验准确率与召回率等核心验证维度。颗粒度精确至算法参数组、实验批次、样本分类层级,支持跨算法、跨场景的性能对比与优化。数据结构遵循机器学习领域标准的算法实验框架,字段定义符合保险风险管理的专业口径。
该数据集为保险欺诈识别算法的迭代优化提供支撑。保险欺诈直接影响行业赔付成本与风控效率,通过算法参数与验证结果的关联分析,可提升欺诈识别模型的精度与鲁棒性。
字段详情
数据集包含以下核心字段:
algorithm_id:算法标识,唯一标识不同欺诈识别算法型号与版本
param_config:参数配置,指算法的核心调参组合,如阈值、正则化系数等
fraud_feature_weight:欺诈特征权重,指各风险特征在算法中的贡献度,无单位
experiment_accuracy:实验准确率,单位百分比,指算法识别真实样本的比例
experiment_recall:实验召回率,单位百分比,指算法识别欺诈样本的比例
scenario_type:场景类型,指实验对应的保险业务场景,如车险理赔、健康险理赔等
适用场景
- 保险监管机构评估市场主流欺诈识别算法的有效性与合规性
- 保险科技企业迭代优化自有欺诈识别模型的参数配置与特征选择
- 风险管理研究机构分析不同算法在保险欺诈场景中的性能差异
- 保险公司验证内部风控模型的欺诈识别能力与边界条件"