LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag

LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag 数据来源:互联网公开数据 标签:语音识别,活动检测,VAD,LibriSpeech,标记数据,音频处理,语音分析,机器学习

数据概述: 本数据集包含LibriSpeech语料库中语音样本的活动检测(VAD)标记。数据集使用8000Hz的采样率,每个检测窗口为30毫秒,窗口之间有50%的重叠。每个标记区域为100毫秒,标记区域之间也有50%的重叠。标记方法采用“max”决策函数。

文件命名结构如下: (8000_30_50_100_50_max.csv)

字段名称及其含义: - sample_rate:采样率,单位为Hz - vad_window_ms:VAD检测窗口大小,单位为毫秒 - vad_overlap_percent:VAD检测窗口的重叠百分比 - label_region_ms:标记区域大小,单位为毫秒 - label_overlap_percent:标记区域的重叠百分比 - decision_function_name:决策函数名称,此处为“max”

数据用途概述: 该数据集适用于语音识别研究、活动检测算法评估、语音信号处理、机器学习模型训练与测试等多种场景。研究人员可以利用此数据集评估和改进语音活动检测技术,训练语音识别模型,以及分析语音信号的特征。教育者可以使用此数据集进行语音信号处理课程的教学演示和实践。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 21, 2025, 12:45 (UTC)
创建于 四月 21, 2025, 12:45 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。