数据集

语音欺诈检测数据集

语音欺诈检测数据集_Speech_Fraud_Detection_Dataset

数据来源：互联网公开数据

标签：语音识别, 欺诈检测, 声纹识别, 机器学习, 音频分析, 二分类, 深度学习, 语音安全

数据概述：该数据集包含用于语音欺诈检测的音频数据，记录了真实语音（bonafide）和欺诈语音（spoof）的样本。主要特征如下：时间跨度：数据未明确标注时间范围，适用于静态数据集。地理范围：数据来源未明确标注，推测为通用语音样本。数据维度：数据集包括“ID”（样本唯一标识符）、“PATH”（音频文件路径）、“TYPE”（语音类型，bonafide表示真实语音，spoof表示欺诈语音）、“LABEL”（类别标签，0代表真实语音，1代表欺诈语音）四个字段。数据格式：CSV格式，包括train.csv（训练集）、dev.csv（开发集）和eval.csv（评估集），以及对应的.pth缓存文件，方便深度学习模型的训练和评估。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于语音识别、声纹识别、欺诈检测等领域的学术研究，如语音欺诈检测算法的开发与评估。行业应用：为安全行业和金融行业提供数据支持，特别是在身份验证、风险控制等领域。决策支持：支持构建语音欺诈检测系统，提升安全防护能力。教育和培训：作为语音识别、机器学习相关课程的实训素材，帮助学生理解并实践欺诈检测技术。此数据集特别适合用于训练和评估语音欺诈检测模型，探索不同算法在识别欺诈语音方面的性能表现，并提升模型的泛化能力。

数据与资源

语音欺诈检测数据集_Speech_Fraud_Detection_Dataset.zipZIP
667.45 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	667.45 MiB
最后更新	2025年8月17日
创建于	2025年8月17日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

语音欺诈检测数据集

数据与资源

附加信息

注册成功！