男女声音数据集

男女声音数据集 数据来源:互联网公开数据 标签:声音识别,性别识别,频率分析,机器学习,数据特征,语音信号,频谱分析,性别分类 数据概述: 本数据集包含使用Python Librosa库提取的男性和女性声音录音特征。数据集包括3682个男性声音样本和2311个女性声音样本,共计5993个样本。每个样本通过Librosa库进行频率分析,提取出平均频率、频率分布的标准差、中位数频率等22个特征。 数据用途概述: 该数据集适用于各种机器学习任务,如基于声音特征的性别分类、分析男性和女性声音的频率特征、探索性别之间的声学模式差异等。研究人员可以利用此数据集开发性别识别模型,分析不同性别声音的特征,以及研究性别在声音模式上的差异。 数据特征: mean_freq: 语音信号的平均频率。 sd_freq: 频率分布的标准差。 median_freq: 语音信号的中位数频率。 q25_freq: 频率分布的第25百分位数。 q75_freq: 频率分布的第75百分位数。 iqr_freq: 频率分布的四分位距。 skewness: 频率分布的偏度。 kurtosis_val: 频率分布的峰度。 spectral_flatness: 功率谱的平坦度。 tempogram: 时域节奏分析特征。 mode_freq: 语音信号的众数频率。 centroid_freq: 语音信号的质心频率。 peak_freq: 语音信号的峰值频率。 mean_fun: 语音信号的基本频率平均值。 min_fun: 语音信号的基本频率最小值。 max_fun: 语音信号的基本频率最大值。 mean_dom: 语音信号的主导频率平均值。 min_dom: 语音信号的主导频率最小值。 max_dom: 语音信号的主导频率最大值。 fund_freq: 语音信号的基本频率。 mod_index: 语音信号的调制指数。 label: 语音样本的性别标签(male, female)。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.83 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。