-
ErhuPT_Based_二胡演奏技法音频数据集
2026年1月31日 30 63 43
数据集概述 本数据集为二胡演奏技法音频数据集(ErhuPT),包含约1500段由多位专业演奏者录制的音频片段,涵盖分弓、垫弓、泛音、连弓&滑音&大滑音、打击类音效、拨弦、抛弓、顿弓、颤弓、颤音、揉弦共11类演奏技法,每类技法下细分不同表现形式(如力度、方向等)。 文件详解 文件名称:ErhuPT.zip 文件格式:ZIP...
-
Maestro_Platform_Based分类声音文件数据集
2026年1月28日 30 176 110
数据集概述 本数据集由Maestro平台生成,包含分类后的声音文件及对应分类结果,系论文《Maestro: An Extensible General-Purpose Data Gathering and Data Classification Platform》中提及的声音数据集,可用于声音分类相关研究与应用。 文件详解 压缩文件: 文件名称:...
-
SELDnet_Based声音事件定位检测联合测量结果数据2019
2026年2月6日 0 120 0
数据集概述 本数据集为SELDnet方法在声音事件定位与检测任务中的结果,对应5、25、75个训练周期的不同状态,基于TAU Spatial Sound Events 2019麦克风阵列数据集的四组交叉验证分割数据生成,含4个文件,用于支持声音事件定位与检测的技术研究。 文件详解 压缩文件组(Archive files)...
-
VOCAPRA_Based_山羊养殖场景_自发叫声分类_音频数据集
2026年1月27日 30 44 5
数据集概述 本数据集包含4147个山羊在不同养殖场景下自发发出的叫声音频,所有音频文件为WAV格式,时长均为2秒。叫声按发情、喂食、分娩、受伤或死亡、社交隔离、母仔团聚、母仔分离、陌生访客在场等8种场景分类,旨在支持畜牧养殖的声学监测研究。 文件详解 文件名称:goat_bleatings.zip 文件格式:ZIP...
-
AdoVoc_Pro_Based_弗拉门戈声乐资源音频及标注数据集
2026年1月27日 30 117 5
数据集概述 本数据集包含弗拉门戈演唱专家(两名女歌手和一名男歌手)录制的单音和复音音频文件,涵盖常见弗拉门戈声乐资源,对单音内容进行了时间位置和识别的人工标注,附数据集结构说明文件,用于弗拉门戈声乐资源自动检测研究。 文件详解 文件名称:AdoVoc Pro.zip 文件格式:ZIP...
-
Accent_Classification_Dataset_英国口音分类音频数据集2020
2026年1月17日 30 144 63
数据集概述 本数据集包含英国12种不同口音的音频记录,性别比例为1:1,标注为“_M”(男性)或“_F”(女性)。音频时长30秒,首尾5秒为空白,重采样至8 kHz。还包含谷歌开源数字数据集(1-9),用于测试模型对数据变化的性能。 文件详解 文件名称:Project-20200513T082053Z-003.zip 文件格式:ZIP...
-
蜂箱音频记录数据集
2025年12月23日 30 157 93
数据集概述 该数据集包含一万个蜂箱音频文件,采用标准化命名规则,以WAV格式存储,为蜂箱音频相关研究提供基础数据支持。 文件详解 文件名称: Bee_Audio_Data.zip 文件格式: ZIP压缩包 压缩包内容: 包含一万个WAV格式音频文件,单个音频文件参数如下: 采样率: 8000 Hz 数值数量: 65625 录音时长: 8.203125秒...
-
阿拉伯语语音命令数据集
2025年12月16日 30 185 150
数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
-
DBR_Source_Based_环境音频数据分类数据集
2025年12月15日 30 189 105
数据集概述 该数据集是为坦佩雷理工大学信号处理学士研讨会创建的环境音频数据集,包含狗、鸟、雨三类音频样本,每类50个,数据来自Freesound在线音频数据库。 文件详解 文件名称: dbr-dataset.zip 文件格式: ZIP压缩包 内部内容: 三个分类文件夹(dog、bird、rain),各含50个原始WAV音频文件...
-
巴西节奏乐器数据集
2025年12月13日 30 137 57
数据集概述 该数据集是为音乐信息检索(MIR)研究开发的巴西传统节奏乐器音频合集,包含367首曲目,涵盖10类乐器及桑巴、阿尔托派对等5种主要巴西节奏风格,适用于节奏、节拍追踪和模式识别研究。 文件详解 文件名称: BRID - Description.pdf:PDF格式文档,可能包含数据集的详细说明、背景信息或使用指南。 文件名称:...
-
vocadito单声部人声带基频音符和歌词标注数据集
2025年12月11日 30 93 46
数据集概述 该数据集包含四十段单声部人声演唱的短音频片段,涵盖七种语言,由不同训练水平的歌手使用多种设备录制,标注内容由专业音乐人完成,为单声部人声的语音与音乐特征分析提供基础数据。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: vocadito.zip - 文件格式: ZIP (.zip) - 包含内容:...
-
卡宾达葡萄牙语语言接触研究音频示例数据集
2025年12月10日 30 187 37
数据集概述 本数据集包含论文《Você + 2SG in Cabindan Portuguese (Angola): Two Effects of Language Contact》中所有示例的音频文件,基于卡宾达地区访谈语料库节选,用于展示安哥拉卡宾达葡萄牙语的语言接触现象。 文件详解 音频文件(共30个): 文件格式:.wav...
-
CitySpeechMix语音与城市声音混合模拟数据集
2025年12月7日 30 131 48
数据集概述 本数据集是模拟音频数据集,将LibriSpeech的语音片段与SONYC-UST的环境录音混合,生成语音与背景噪声的受控混合数据。包含三百七十一条混合音频和三百七十一条无语音城市环境录音,每条音频时长十秒,附语音转录和环境声音类别标签。 文件详解 压缩文件: cityspeechmix.zip: 包含数据集核心内容,分为两个子文件夹...
-
PodcastMix播客音乐与语音分离数据集
2025年12月5日 30 121 97
数据集概述 该数据集用于播客中的背景音乐与前景语音分离任务,包含44.1kHz音频文件及对应元数据。因Zenodo限制,此处仅提供元数据,完整数据集需从指定Google Drive链接获取,为音频分离算法研究提供支持。 文件详解 核心文件: podcastmix.zip: ZIP压缩格式,包含Zenodo上托管的元数据文件 说明:...
-
音频数据集Group5CreatedAudioDataset-ashishgoraniya
2025年4月24日 30 108 12
音频数据集Group5CreatedAudioDataset-ashishgoraniya 数据来源:互联网公开数据 标签:音频数据集, 数据集, 语音识别, 机器学习, 语音处理, 深度学习, 音频分析, 音频技术 数据概述: 该数据集由Group5创建,主要记录了各种场景下的音频数据,适用于语音识别,音频分析等任务。主要特征如下:...
-
用于音频字幕生成的2021发布版Clotho音频标注数据集
2025年4月15日 30 54 39
用于音频字幕生成的2021发布版Clotho音频标注数据集 数据来源:互联网公开数据 数据概述: 由芬兰坦佩雷大学(Tampere University)开发并维护,音频内容来源于 Freesound 平台(https://freesound.org),相关数据与标注遵循 Freesound 授权协议和 Tampere University...



