城市环境声音分类识别声谱图数据集-UrbanSound8K-smaildurcan

城市环境声音分类识别声谱图数据集-UrbanSound8K-smaildurcan 数据来源:互联网公开数据 标签:声音,声谱图,城市,环境,分类,音频,机器学习,深度学习,UrbanSound8K

数据概述: 本数据集包含8732个标注的城市声音片段(时长小于等于4秒)的声谱图图像,源自10个不同的声音类别,包括:空调、汽车喇叭、儿童玩耍、狗叫、电钻、引擎空转、枪声、电钻、警笛和街头音乐。这些声音类别基于城市声音分类体系进行划分。数据集中提供的图像均为.png格式。 除了声谱图图像外,数据集还附带一个CSV文件,其中包含关于每个声音片段的元数据信息。

元数据文件(UrbanSound8k.csv)包含以下字段:

slice_file_name:音频文件名,格式为 [fsID]-[classID]-[occurrenceID]-[sliceID].wav,其中: [fsID]:Freesound录音的ID [classID]:声音类别的数字标识符 [occurrenceID]:区分原始录音中不同声音出现次数的数字标识符 [sliceID]:区分从同一出现位置截取的不同片段的数字标识符 fsID:Freesound录音的ID start:片段在原始Freesound录音中的开始时间 end:片段在原始Freesound录音中的结束时间 salience:声音的(主观)显著性评级,1 = 前景,2 = 背景 fold:该文件被分配到的折叠编号(1-10) classID:声音类别的数字标识符,0-9对应于上述10个类别 class:声音类别的名称,例如:air_conditioner, car_horn等

数据用途概述: 该数据集主要用于城市环境声音的识别、分类和分析,适用于机器学习、深度学习等领域的研究和应用。研究人员可以使用该数据集训练和评估声音分类模型,开发智能音频分析系统,或进行城市环境声音的特征提取与分析。具体应用场景包括: 1. 声音事件检测:检测城市环境中的特定声音事件。 2. 智能监控:用于智能监控系统,检测异常声音。 3. 城市噪声监测:用于城市噪声污染的监测与分析。 4. 声音场景理解:用于理解复杂的城市声音场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 418.88 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。