语音克隆及音调添加音频与音高数据集1963-2021
数据来源:互联网公开数据
标签:语音克隆,音调添加,音频分析,音高数据,语音识别,音频分类,音高检测
数据概述:
本数据集由两个主要部分组成:原始音频文件和提取的音高数据。原始音频文件部分包含50个WAV格式的音频文件,这些文件可能包含讲话、音乐或其他音频内容。音高数据部分则包括从这些音频文件中提取的音高信息,具体表现为50个对应的音高数据文件,格式可能为文本、CSV或JSON等。此外,数据集还包含音高变化信息,即每个音频文件中检测到的最高和最低音高的差值。
数据用途概述:
本数据集适用于各种音频分析任务,包括语音识别、音频分类和音高检测等。提取的音高数据特别适用于音高跟踪、音频分割和语调分析等场景。研究人员可利用此数据进行语音韵律分析、音乐信息检索等研究,或开发涉及音高检测的应用程序。此外,数据集也适合用于教育培训,帮助学习者理解和掌握音高分析的相关技术。
举例:
原始音频文件部分包含编号从1.wav到50.wav的音频文件,每个文件的格式为标准的WAV格式,未经过压缩处理。音高数据部分则为与之对应的音高信息文件,记录了每个音频文件的音高变化情况,格式为表格形式,包含两列:音频文件名和音高变化(以赫兹为单位)。例如,音频文件1.wav的音高变化为200 Hz,表示该文件中检测到的最高音高与最低音高的差值为200赫兹。