医疗保险欺诈检测数据集

医疗保险欺诈检测数据集_Healthcare_Fraud_Detection_Dataset

数据来源:互联网公开数据

标签:医疗保险, 欺诈检测, 医疗服务, 医生信息, 费用分析, 机器学习, 数据挖掘, 风险评估

数据概述: 该数据集包含来自医疗保险理赔的数据,记录了医疗服务提供者的相关信息、医疗服务类型、费用以及欺诈标签。主要特征如下: 时间跨度:数据未明确标注时间范围,可视为静态数据集。 地理范围:数据未明确标注地理范围,但从数据字段推测可能来源于美国。 数据维度:数据集包含多个维度,包括医生信息(如NPI号码、姓名、执业类型、邮编等)、医疗服务信息(如HCPCS代码、服务描述)、费用信息(如总受益人数、总服务次数、平均申报费用、平均允许费用、平均医疗保险支付金额、平均标准化金额)以及欺诈标签(Label,0表示非欺诈,1表示欺诈)。 数据格式:CSV格式,文件名为label_data.csv,便于数据分析与处理。 来源信息:数据来源可能为公开的医疗保险理赔数据,已进行匿名化处理。 该数据集适合用于医疗保险欺诈检测、风险评估和医疗服务费用分析等领域。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于医疗健康领域学术研究,如医疗欺诈行为模式分析、异常理赔识别、医疗费用影响因素分析等。 行业应用:为医疗保险公司、医疗服务提供商提供数据支持,用于风险管理、欺诈检测、理赔审核流程优化等。 决策支持:支持医疗保险行业的风险控制策略制定,辅助保险公司进行欺诈调查和预防。 教育和培训:作为医疗健康数据分析、机器学习、风险管理等课程的实训材料,帮助学生和研究人员理解医疗欺诈检测的实践应用。 此数据集特别适合用于探索医疗服务费用与欺诈行为之间的关系,帮助用户建立欺诈检测模型、优化风险控制措施。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 702.71 MiB
最后更新 2026年3月11日
创建于 2026年3月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。