城市声音8K梅尔频谱图数据集

城市声音8K梅尔频谱图数据集 数据来源:互联网公开数据
标签:声音分类,城市环境,音频分析,梅尔频谱图,机器学习,声音识别,数据集

数据概述:
本数据集包含了来自10个声音类别的8732张梅尔频谱图图像,声音类别包括空调器、汽车喇叭、儿童玩耍、狗叫声、钻机声、发动机空转、枪声、碎石机、警报器和街头音乐。每张图像代表一个声音片段,经过预处理转换为梅尔频谱图形式,便于声音特征提取和分类任务。数据集中的文件按10个fold(fold1-fold10)组织,便于实验结果的复现和对比。此外,数据集中还包含一个CSV格式的元数据文件(UrbanSound8k.csv),记录了每个声音片段的详细信息,包括文件名、Freesound记录ID、片段起止时间、声音显著性评分、所属fold编号以及声音类别等关键信息。

数据用途概述:
该数据集适用于多种声音分类任务,包括但不限于城市环境声音识别、声音特征提取与分析、机器学习模型训练与验证等场景。研究人员可以利用此数据集进行声音分类算法的研究与优化,评估不同模型在城市声音识别任务中的性能表现。开发者可以基于数据集开发声音识别系统,应用于智能音频检测、城市环境监测等领域。此外,数据集还适合用于教育和培训场景,帮助学习者理解声音分类的基本原理和实践方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 896.75 MiB
最后更新 2025年6月4日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。