业余人声打击乐数据集

数据集概述

该数据集包含业余人员对打击乐声音的人声模仿数据,共9780段发声,280个音频文件,由28名无或少量beatbox经验的参与者录制。数据集标注了底鼓、军鼓、闭合踩镲、开放踩镲的起始点及标签,还包含起始音素和结尾音素标签及噪声样本音频文件。

文件详解

  • 压缩包文件:
  • AVP_Dataset.zip: ZIP格式压缩包,包含所有音频文件和标注文件
  • 音频文件:
  • 280个音频文件(格式未明确说明),由MacBook Pro内置麦克风在室内环境录制,分为个人模仿和固定模仿两种模式
  • 每个模式下,每位参与者有4个同类发声重复文件和1个节奏即兴文件
  • 标注文件:
  • 多个CSV格式文件,标注底鼓、军鼓、闭合踩镲、开放踩镲的起始点及标签
  • 新增起始音素和结尾音素标签的CSV文件
  • 补充文件:
  • 噪声样本音频文件(格式未明确说明)

适用场景

  • 音乐信息检索研究: 分析人声模仿打击乐的声学特征
  • 语音信号处理: 研究人声打击乐的音素特征和节奏模式
  • 机器学习模型训练: 用于人声打击乐声音分类和识别模型开发
  • 音乐教育应用: 辅助beatbox教学和练习效果评估
  • 音频合成研究: 探索基于人声模仿的打击乐合成技术
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 220.15 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。