找到473个数据集

标签: 语音处理

过滤结果
  • 语音情感合成数据库

    2025年12月14日   

    数据集概述 本数据集为公开的语音情感合成数据库,包含基于双音素合成器规则操控生成的三种基本情绪及中性表达的合成语音数据,经机器学习实验验证可用于训练自然语音情感识别模型。 文件详解 文件名称: syntact_cat.zip 文件格式: ZIP压缩包 内容说明: 包含用于语音情感识别的合成语音数据,具体文件结构需解压后查看 适用场景 语音情感识别研究:...
    packageimg
  • 基于隐马尔可夫模型的语音特征提取数据集

    2025年12月14日   

    数据集概述 该数据集围绕语音识别展开,提出结合隐马尔可夫模型(HMM)的混合语音识别模型,通过噪声去除、语音停顿检测、分帧加窗特征提取等阶段实现语音转文本,使用Praat工具实施,模型评估指标为F值(98%)和准确率(99%)。 文件详解 文件名称:Suppl File - Speech to Text - Latest.pdf 文件格式:PDF...
    packageimg
  • 圣维森特岛佛得角克里奥尔语数据集2019

    2025年12月13日   

    数据集概述 本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。 文件详解 该数据集包含11个文件,按类型分类说明如下: - PDF文档类(共4个): -...
    packageimg
  • 情感合成音频数据集2018

    2025年12月13日   

    数据集概述 本数据集为情感合成音频数据集,包含一百四十四段合成音频文件,由四十位听众基于效价和唤醒度两个维度对音频的感知情绪进行标注。数据可用于研究合成音频的情绪感知规律,为情感计算领域提供支持。 文件详解 文件名称: emoSynth-DB-fix.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
    packageimg
  • 帕金森病患者与健康人群语音特征数据集_Rasta_PLP_V2

    2025年12月13日   

    数据集概述 该数据集包含西班牙卡斯蒂利亚语使用者中,四十七名帕金森病患者与三十二名健康对照者的语音Rasta-PLP特征数据,涉及六个句子的语音记录。数据还补充了患者的UPDRS评分、H&Y分期、确诊年限及年龄等临床信息,为帕金森病语音检测研究提供支持。 文件详解 语音特征压缩文件(共六个):...
    packageimg
  • 声学研究用人体几何结构数据库IHA_v1

    2025年12月13日   

    数据集概述 该数据集是IHA数据库的首个版本,包含十例人体几何结构样本,涵盖躯干、头部及完整外耳(含耳道与鼓膜)。数据支持两种3D对象格式,为声学研究提供基础数据。 文件详解 数据集包含三个文件,具体说明如下: - IHA_database_License_Info_v1.pdf:PDF格式文档文件,提供数据库的许可信息。 -...
    packageimg
  • 语音转灯具语音数据集

    2025年12月13日   

    数据集概述 该数据集包含一千零六十个音频文件,总时长约一点一八小时,收录了五名受试者(两名女性、三名男性)用英语和西班牙语朗读“文本转灯具”数据集测试样本提示语的语音录音,数据采集符合伦理规范与数据保护法规。 文件详解 核心文件: data.zip:压缩包格式,包含所有加密的音频文件,需使用指定脚本解密 解密工具:...
    packageimg
  • 法国朗伯德语音数据集

    2025年12月12日   

    数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
    packageimg
  • Maxsudova_Xolisxon_Ummatovna1_Terminal_Learing_Based_终端学习语音特性研究完整数据

    2025年12月12日   

    数据集概述 本数据集包含一份关于终端学习语音特性的PDF文档,主要围绕语音相关的特性展开,未提供具体描述信息,为语音特性相关研究提供基础文档支持。 文件详解 文件名称: Maxsudоva Xоlisxоn Ummatоvna1.pdf 文件格式: PDF (.pdf) 文件内容: 文档文件,内容围绕TERMINLARNING FONETIK...
    packageimg
  • Bach10乐谱引导的音源分离数据集ISMIR2017

    2025年12月12日   

    数据集概述 该数据集是ISMIR2017会议论文的配套数据,基于Bach10数据集(含10首巴赫众赞歌)构建,包含论文中提出的卷积神经网络及乐谱引导NMF方法的音源分离结果,涵盖SDR、SIR、SAR指标数据和音频文件,以及训练好的CNN模型。 文件详解 文件名称: Bach10scoreinformed.zip 文件格式: ZIP(压缩包)...
    packageimg
  • vocadito单声部人声带基频音符和歌词标注数据集

    2025年12月11日   

    数据集概述 该数据集包含四十段单声部人声演唱的短音频片段,涵盖七种语言,由不同训练水平的歌手使用多种设备录制,标注内容由专业音乐人完成,为单声部人声的语音与音乐特征分析提供基础数据。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: vocadito.zip - 文件格式: ZIP (.zip) - 包含内容:...
    packageimg
  • 西班牙式等口音英语单词语料库

    2025年12月11日   

    数据集概述 该数据集为西班牙语口音英语单词语料库(SIAEW),包含单音节英语单词,其中一个音节(目标音节)被替换为不同程度的西班牙语口音版本,共5个等间隔的口音等级,由母语者判定。 文件详解 文件名称:SIAEW.pdf,文件格式:PDF,内容为SIAEW语料库的详细描述文档...
    packageimg
  • 耳机音频空间化脉冲响应数据集

    2025年12月11日   

    数据集概述 该数据集包含用于耳机空间音频系统双耳合成的脉冲响应数据,包括双耳房间脉冲响应(BRIRs)、耳机补偿滤波器(HpCFs)及Equalizer APO配置文件,可通过卷积音频流实现耳机空间环绕声效果。 文件详解 文件名称: ASH_IR_Dataset_v8.0.0.zip 文件格式: ZIP压缩包 压缩包内容:...
    packageimg
  • 口罩对声音辐射影响的方向性测量数据集

    2025年12月11日   

    数据集概述 本数据集包含使用HEAD acoustics HMS II.3头口模拟器测量的不同类型口罩对声音辐射方向性影响的SOFA格式数据。涵盖无口罩参考组及六种不同类型口罩(含两次重复测量),基于“GeneralFIR”约定,为研究口罩对声音传播特性的影响提供基础数据。 文件详解...
    packageimg
  • DISPLACE2024_Track3_Based_多语言对话ASR评估标签完整数据

    2025年12月11日   

    数据集概述 该数据集为DISPLACE2024挑战赛的官方数据,包含多语言多说话人自然对话内容,涵盖代码混合/切换、自然重叠、混响及噪声等多样化特征。数据用于挑战赛的开发与评估,未提供训练数据,仅包含开发和评估用的自然对话数据集,支持参与者进行模型适配。 文件详解 文件名称:Track3_ASR_eval_segment_labels.zip...
    packageimg
  • Zenodo_Annotated_VocalSet_Based_歌唱语音多维度标注完整数据集

    2025年12月11日   

    数据集概述 该数据集是对VocalSet数据集的标注补充,包含歌唱语音的基频轮廓、音符起止点、音高转换等关键标注信息,旨在提升原数据集的研究价值,为歌唱语音相关研究提供支持。 文件详解 文件名称:Annotated VocalSet.zip 文件格式:ZIP压缩包...
    packageimg
  • 柏林情感语音数据库2_0

    2025年12月10日   

    数据集概述 该数据集是柏林情感语音数据库2.0版本,包含十位演员(五位女性、五位男性)模拟七种情感录制的约八百句德语日常语句,同时记录了电声门图数据。数据按四位说话人划分为测试集、六位划分为训练集,音频为16kHz WAV格式,元信息采用audformat格式存储,还补充了模糊样本。 文件详解 文件名称: emodb_2.0.zip 文件格式:...
    packageimg
  • 京剧打击乐器数据集2013

    2025年12月10日   

    数据集概述 本数据集收录了京剧四类打击乐器(板鼓、铙钹、大锣、小锣)的单音音频样本,包含不同乐器实例及演奏技法的录音,为京剧打击乐声音特征分析与模型训练提供基础数据。 文件详解 文件名称: beijing_opera_percussion_instrument_1.0.zip 文件格式: ZIP压缩包 压缩包内容说明:...
    packageimg
  • 英语音素范围_发音方式与发音部位探索数据集

    2025年12月10日   

    数据集概述 本数据集聚焦英语语言中的音素,围绕发音方式与发音部位展开探索,通过单篇PDF文档呈现相关研究内容,为英语语音学领域的音素特征分析提供基础资料。 文件详解 文件名称:GaniyevaDildoraAzizovna.pdf 文件格式:PDF(.pdf) 文件内容:围绕英语音素的发音方式与发音部位主题展开的文档,具体内容需查阅PDF原文 适用场景...
    packageimg
  • BASS_dB_Based_多轨音乐录音数据集_音乐源分离测试完整数据

    2025年12月10日   

    数据集概述 该数据集包含多轨音乐录音文件,用于评估音乐源分离算法。部分数据曾作为第一届立体声音频源分离评估活动的评估材料,为相关算法的性能测试提供支持。 文件详解 该数据集由21个文件组成,具体说明如下: - 许可文件: - LICENSE.xml: XML格式文件,包含数据集的内容和许可信息说明。 - 音频压缩文件: -...
    packageimg