语音克隆及音调添加音频与音高数据集1963-2021

语音克隆及音调添加音频与音高数据集1963-2021 数据来源:互联网公开数据 标签:语音克隆,音调添加,音频分析,音高数据,语音识别,音频分类,音高检测

数据概述: 本数据集由两个主要部分组成:原始音频文件和提取的音高数据。原始音频文件部分包含50个WAV格式的音频文件,这些文件可能包含讲话、音乐或其他音频内容。音高数据部分则包括从这些音频文件中提取的音高信息,具体表现为50个对应的音高数据文件,格式可能为文本、CSV或JSON等。此外,数据集还包含音高变化信息,即每个音频文件中检测到的最高和最低音高的差值。

数据用途概述: 本数据集适用于各种音频分析任务,包括语音识别、音频分类和音高检测等。提取的音高数据特别适用于音高跟踪、音频分割和语调分析等场景。研究人员可利用此数据进行语音韵律分析、音乐信息检索等研究,或开发涉及音高检测的应用程序。此外,数据集也适合用于教育培训,帮助学习者理解和掌握音高分析的相关技术。

举例: 原始音频文件部分包含编号从1.wav到50.wav的音频文件,每个文件的格式为标准的WAV格式,未经过压缩处理。音高数据部分则为与之对应的音高信息文件,记录了每个音频文件的音高变化情况,格式为表格形式,包含两列:音频文件名和音高变化(以赫兹为单位)。例如,音频文件1.wav的音高变化为200 Hz,表示该文件中检测到的最高音高与最低音高的差值为200赫兹。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 6.47 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。