性别识别语音数据集-2011-mexwell

性别识别语音数据集-2011-mexwell 数据来源：互联网公开数据标签：性别识别,语音数据,声学分析,机器学习,音频处理,教育,科研

数据概述：本数据集用于通过语音和言语分析性别。数据集包含数千个男性和女性的语音样本，每个样本均标注为男性或女性。语音样本来自以下资源：

每个语音样本以.WAV文件存储，并使用WarbleR R包中的specan函数进行预处理。specan函数测量了提供起始和结束时间的声学信号的22个声学参数。

预处理后的.WAV文件输出存储为CSV文件，包含3168行和21列（20个特征列和1个标签列用于分类男性或女性）。用户可通过上述链接下载预处理后的CSV格式数据集。

声学属性测量

以下是测量的每个语音的声学属性：

注意，特征duration和peakf（峰值频率）未用于训练。duration指录音长度，对于训练，被截断为20秒。由于计算此值的时间和CPU限制，peakf被省略。在这种情况下，所有记录的duration值（20秒）和peakf值（0）相同。

原始数据

致谢

图片来自Jason Rosewell在Unsplash上的作品

数据与资源

字段	值
版本	1.0
数据集大小	0.39 MiB
最后更新	2025年4月23日
创建于	2025年4月23日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。