谷歌音频事件检测数据集1963-2021

谷歌音频事件检测数据集1963-2021 数据来源:互联网公开数据 标签:音频事件,数据集,YouTube,声音分类,机器学习,音频分析,研究工具 数据概述: 谷歌音频事件检测数据集(AudioSet)包含来自YouTube视频的大量人工标注的10秒音频片段,共计2,084,320个。这些音频片段覆盖了632种音频事件类别,构建了一个广泛的声音词汇表。数据集中的声音事件涵盖了人类和动物声音、乐器和音乐风格、以及常见的环境声音等广泛类别。这些类别被组织成一个层次结构的图谱,用于详细描述每种声音事件。

数据用途概述: 该数据集广泛应用于音频事件检测的研究和开发中,可以作为评估音频事件检测模型性能的基准任务。此外,研究人员和开发人员可以利用这个庞大的声音词汇表来进行相关研究,探索新的音频事件类别,或者扩展现有的分类体系。教育机构和研究人员也可以使用此数据集进行教育培训,帮助学习者理解不同声音事件的特征和分类方法。

举例: 例如,AudioSet数据集中包含的声音事件类别包括“狗吠”、“钢琴演奏”、“雨声”等。这些类别被组织成层次结构,例如“动物声音”可以进一步细分为“狗吠”、“鸟鸣”等。研究人员可以通过这些标注好的音频片段来训练和测试自动声音检测和分类模型。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 25.62 MiB
最后更新 2025年4月19日
创建于 2025年4月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。