找到534个数据集

标签: WAV

过滤结果
  • 音乐情感分类声学特征数据集-10133样本-akhilnshukla

    2025年4月22日   

    音乐情感分类声学特征数据集-10133样本-akhilnshukla 数据来源:互联网公开数据 标签:音乐情感,声学特征,MFCC,音频处理,音乐分类,情绪识别,机器学习,情感分析 数据概述:...
    packageimg
  • 音频样本库分类数据集-nethasha

    2025年4月21日   

    音频样本库分类数据集-nethasha 数据来源:互联网公开数据 标签:音频样本,音乐制作,声音设计,音频分析,样本分类,音频特征,文件信息 数据概述: 本数据集包含了一系列音频样本文件信息,这些样本文件按类别进行了划分,并提供了详细的元数据。 数据集旨在为音乐制作、声音设计、音频分析等领域提供基础数据支持。...
    packageimg
  • UQ阿瓦兹阿米里语音数据集-2011-kawichi

    2025年4月21日   

    UQ阿瓦兹阿米里语音数据集-2011-kawichi 数据来源:互联网公开数据 标签:语音数据集,文本转语音,深度学习,Uyghur语,音频处理,科学研究,教育,数据集 数据概述: 本数据集是由昆士兰大学(UQ)开发的UQ阿瓦兹阿米里(UQ Awaz Ambiri),旨在通过深度学习技术推进Uyghur语文本转语音(Text To Speech,...
    packageimg
  • 自由发音数字音频数据集

    2025年4月21日   

    自由发音数字音频数据集 数据来源:互联网公开数据 标签:语音识别,音频,数字,语音,机器学习,数据集,FSDD,开源 数据概述: 自由发音数字数据集(FSDD)是一个简单、开放的音频数据集,包含以8kHz采样率录制的英语数字语音wav文件。数据集中的录音经过剪辑,以最大限度地减少开头和结尾的静音。 数据集当前版本包括: 6位说话者...
    packageimg
  • 贝罗姆语音数据集

    2025年4月18日   

    贝罗姆语音数据集 数据来源:互联网公开数据 标签:贝罗姆语,语音数据,低资源语言,语音识别,语言研究,文本转语音 数据概述:...
    packageimg
  • 多源融合特征工程数据集

    2025年4月15日   

    多源融合特征工程数据集 数据来源:互联网公开数据 标签:特征工程,数据融合,机器学习,音频处理,硬件测试 数据概述:...
    packageimg
  • 英国英语语音识别数据集1963-2021

    2025年4月15日   

    英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:...
    packageimg
  • 用于音频字幕生成的2021发布版Clotho音频标注数据集

    2025年4月15日   

    用于音频字幕生成的2021发布版Clotho音频标注数据集 数据来源:互联网公开数据 数据概述: 由芬兰坦佩雷大学(Tampere University)开发并维护,音频内容来源于 Freesound 平台(https://freesound.org),相关数据与标注遵循 Freesound 授权协议和 Tampere University...
    packageimg
  • 自然背景声音数据集

    2025年4月15日   

    自然背景声音数据集 数据来源:互联网公开数据 标签:自然声音,背景噪音,环境音频,鸟类研究,数据增强,声音识别 数据概述...
    packageimg
  • 两栖动物鸣叫声分类数据集

    2025年4月14日   

    两栖动物鸣叫声分类数据集 数据来源:互联网公开数据 标签:两栖动物,鸣叫声,音频分类,声学特征,动物学研究,生态监测,机器学习 数据概述:...
    packageimg
  • 韩国男性元音语音数据集

    2025年4月14日   

    韩国男性元音语音数据集 数据来源:互联网公开数据 标签:语音数据,韩语元音,声学特征,语音信号处理,语音识别,声学分析,语音质量评估 数据概述: 本数据集包含一位30岁韩国男性(非专业配音演员)的元音语音记录,采用WAV格式,采样率为48kHz,16位深度。语音录制使用CM7010 USB麦克风完成,经过GoldWave...
    packageimg
  • 语音克隆及音调添加音频与音高数据集1963-2021

    2025年4月14日   

    语音克隆及音调添加音频与音高数据集1963-2021 数据来源:互联网公开数据 标签:语音克隆,音调添加,音频分析,音高数据,语音识别,音频分类,音高检测 数据概述:...
    packageimg
  • 肠鸣音数据集

    2025年4月14日   

    肠鸣音数据集 数据来源:互联网公开数据 标签:肠鸣音,音频信号,深度学习,医学诊断,健康监测,声音识别,医疗数据 数据概述:...
    packageimg
  • 多源情感数据集

    2025年4月14日   

    多源情感数据集 数据来源:互联网公开数据 标签:情感识别,语音数据,情绪分类,音频分析,RAVDESS,CREMA-D,SAVEE 数据概述: 本数据集是由RAVDESS、CREMA-...
    packageimg