男女声音数据集
数据来源:互联网公开数据
标签:声音识别,性别识别,频率分析,机器学习,数据特征,语音信号,频谱分析,性别分类
数据概述:
本数据集包含使用Python Librosa库提取的男性和女性声音录音特征。数据集包括3682个男性声音样本和2311个女性声音样本,共计5993个样本。每个样本通过Librosa库进行频率分析,提取出平均频率、频率分布的标准差、中位数频率等22个特征。
数据用途概述:
该数据集适用于各种机器学习任务,如基于声音特征的性别分类、分析男性和女性声音的频率特征、探索性别之间的声学模式差异等。研究人员可以利用此数据集开发性别识别模型,分析不同性别声音的特征,以及研究性别在声音模式上的差异。
数据特征:
mean_freq: 语音信号的平均频率。
sd_freq: 频率分布的标准差。
median_freq: 语音信号的中位数频率。
q25_freq: 频率分布的第25百分位数。
q75_freq: 频率分布的第75百分位数。
iqr_freq: 频率分布的四分位距。
skewness: 频率分布的偏度。
kurtosis_val: 频率分布的峰度。
spectral_flatness: 功率谱的平坦度。
tempogram: 时域节奏分析特征。
mode_freq: 语音信号的众数频率。
centroid_freq: 语音信号的质心频率。
peak_freq: 语音信号的峰值频率。
mean_fun: 语音信号的基本频率平均值。
min_fun: 语音信号的基本频率最小值。
max_fun: 语音信号的基本频率最大值。
mean_dom: 语音信号的主导频率平均值。
min_dom: 语音信号的主导频率最小值。
max_dom: 语音信号的主导频率最大值。
fund_freq: 语音信号的基本频率。
mod_index: 语音信号的调制指数。
label: 语音样本的性别标签(male, female)。