AVP_LVT_Based_人声打击乐音频与标注数据集_扩展版

数据集概述

本数据集整合了AVP和LVT两个公开数据集的人声打击乐数据,包含四十八名无或极少beatbox经验参与者的音频与标注。数据扩展了原始标注,新增音节级语音标注,遵循国际音标(IPA)规范,包含音头音素与韵尾音素信息,支持人声打击乐的语音与音乐特征分析。

文件详解

  • 文件名称:AVP-LVT_Dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包包含AVP数据集的录音与标注文件、LVT数据集的标注文件,以及数据集构建说明文件“Instructions_to_build_AVP-LVT_Dataset.rtf”。标注内容涵盖乐器类型(kick drum、snare drum、closed hi-hat、opened hi-hat等)、音节级语音标注(音头音素、韵尾音素),说明文件含数据集构建步骤与研究用训练-评估划分信息。

数据来源

Amateur Vocal Percussion (AVP)数据集、Live Vocalised Transcription (LVT)数据集

适用场景

  • 人声打击乐语音特征分析: 利用音节级语音标注,研究人声打击乐的发音机制与音素特征。
  • 音频事件检测研究: 基于乐器类型标注,开发或验证人声打击乐事件检测算法。
  • 音乐信息检索: 探索人声打击乐的音频特征与标注信息在音乐检索中的应用。
  • 数据集构建方法研究: 参考数据集整合与标注扩展的方法,指导多源音频数据集的融合处理。
  • 语音与音乐交叉研究: 分析人声打击乐中语音元素与音乐节奏的关联机制。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 109.4 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。