找到545个数据集

标签: 语音处理

过滤结果
  • The_Hurricane_Challenge_Interspeech_语音增强数据集_2013

    2026年1月11日   

    数据集概述 本数据集是2013年Interspeech举办的The Hurricane Challenge国际语音清晰度增强评估活动的数据集,包含立体声音频文件,其中通道1为干净语音,通道2为噪声。数据集提供两种噪声类型(平稳语音形状噪声、竞争语音),每种噪声含三种信噪比水平,用于在不改变均方根电平及特定时长约束下增强语音清晰度。 文件详解...
    packageimg
  • Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

    2026年1月7日   

    数据集概述 本数据集为Multi-CAST多语言语音文本标注语料库的一部分,包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布,是多语言口语文本标注资源的重要组成,可用于相关语言研究与自然语言处理应用。 文件详解 文件名称:Multi-CAST/mcnkurd-v2311.zip 文件格式:ZIP...
    packageimg
  • Dogs_speech_discrimination_abilities_狗语音感知与归一化研究数据

    2026年1月5日   

    数据集概述 本数据集记录了狗对人类语音中与共振峰相关的说话者和元音差异的感知及自发归一化能力实验数据。通过习惯化-去习惯化范式,探究狗能否跨陌生说话者识别单词或跨单词区分陌生说话者,验证该能力是否为人类独有的特质。包含2个Excel文件,无目录结构。 文件详解 数据文件: 文件名称:Root-Gutteridge_-...
    packageimg
  • osses2021c_S01_osses2021c_S02_Based_语音噪声识别实验数据_2021

    2026年1月2日   

    数据集概述 本数据集包含两组各5000个语音成形噪声(SSN)文件,用于研究基于不同语音决策装置的听觉模型在噪声中识别辅音的能力。数据对应2021年8月17日在奥地利维也纳DAGA会议发表的同名论文,支持相关听觉模型实验的结果验证与分析。 文件详解 osses2021c_S01.zip(参与者S01数据) 文件格式:ZIP 包含内容:...
    packageimg
  • PHON_Replication_Data_西班牙语_加泰罗尼亚语学习者英语发音准确性影响因素研究数据集

    2026年1月1日   

    数据集概述 本数据集为英语作为外语发音准确性影响因素研究的复现数据,包含西班牙语-加泰罗尼亚语中级学习者的英语单词发音语音转录分析。数据记录学习者发音表现,支持探究发音准确性的影响因素,包含2个文件,覆盖数据与说明文档两类内容。 文件详解 README.txt 文件格式:TXT...
    packageimg
  • Single_Sound_Spectral_Clarity_Based_音频频谱均衡感知清晰度预测研究数据

    2025年12月30日   

    数据集概述 本数据集是Kirsten Hermes博士研究的一部分,旨在预测频谱均衡(EQ)对声音感知清晰度的影响。包含音频文件、听力测试界面、实验结果及MATLAB建模与绘图代码,以压缩包形式提供,用于音频感知与频谱处理研究。 文件详解 文件名称:Single_Sound_Spectral_Clarity.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Multi_CAST_Based_Multi_CAST_Teop多语言医疗CT标注语音文本数据集_V1905

    2025年12月29日   

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,聚焦医疗CT相关的语音文本标注内容。数据由班贝格大学发布,版本为1905,包含1个压缩文件,无训练测试或数据标签拆分,核心语义关键词为医疗CT,是研究多语言医疗语音文本标注的基础语料。 文件详解 压缩文件 文件名称:Multi-CAST/mcteop-v1905.zip...
    packageimg
  • f0trans_voice_fundamental_frequency_convergence_dataset

    2025年12月28日   

    数据集概述 本数据集包含30对参与者在交替阅读任务中的语音基频数据,记录了实时人工修改前后的基频值。数据按参与者对ID分文件夹存储,每个文件夹含零相位和π相位条件下的两次任务重复,涵盖基频数据文件和说话轮次时间文件。 文件详解 压缩文件:f0trans.zip 文件格式:ZIP 内容结构: 按参与者对ID命名的独立文件夹...
    packageimg
  • RealVAD真实世界语音活动检测数据集

    2025年12月21日   

    数据集概述 该数据集是用于语音活动检测(VAD)的真实世界数据,基于约八十三分钟的YouTube小组讨论视频构建,包含单通道音频与静态摄像头拍摄的画面,标注了九位多国籍、性别均衡的嘉宾的上半身检测框及语音活动状态,还提供了声学特征。 文件详解 文件名称: RealVADDataset.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Sharvard_Spanish_Balanced_音素平衡西班牙语语音数据完整集合

    2025年12月21日   

    数据集概述 该数据集包含音素平衡的西班牙语句子列表及男女说话人的完整句子录音,适用于语音清晰度测试,基于V. Aubanel等2014年发表的相关论文构建。 文件详解 文件名称:lists-ortho.pdf;文件格式:PDF;内容:音素平衡句子列表,关键词为粗体 文件名称:lists-phonemic-...
    packageimg
  • ESMA_3D沉浸式声景录音数据集

    2025年12月20日   

    数据集概述 该数据集包含基于ESMA-3D麦克风阵列技术录制的沉浸式声景音频。ESMA-3D技术采用8麦克风分层设计,可实现360°空间音频捕捉,具有良好的空间感和稳定的水平/垂直定位效果,适用于沉浸式音频研究与应用。 文件详解 文件名称:ESMA-3D Immersive Soundscape_Manhattan NYC.zip...
    packageimg
  • 智能虚拟代理信任感知与语音特征关联数据集

    2025年12月23日   

    数据集概述 本数据集围绕智能虚拟代理的信任感知展开,包含基于不同语音风格(幽默、中性、礼貌)和任务类型(问题、推荐)的语音刺激文件,以及6个实验收集的信任度评分数据,为研究语音特征对用户信任感知的影响提供支持。 文件详解 压缩文件: speech_generation-main.zip: ZIP格式压缩包,包含以下内容 语音刺激文件(分文件夹存储):...
    packageimg
  • 无声肌电信号特征处理数据集2025

    2025年12月23日   

    数据集概述 本数据集提供了用于ACL 2025论文研究的手工提取无声肌电信号(Silent EMG)特征表示,基于EMNLP 2020提出的原始无声肌电数据集,为探索大语言模型理解无声语音及肌电转文本任务提供支持。 文件详解 文件名称: extracted_emg_features-20250530T194147Z-1-001.zip 文件格式:...
    packageimg
  • DREANSS鼓事件分离标注数据集

    2025年12月22日   

    数据集概述 该数据集包含22段多轨音乐片段的鼓事件标注,片段选自公开多轨音频数据集,涵盖摇滚、雷鬼等多种音乐类型,平均时长10秒。标注按原始音频分离数据集分为四个文件夹,旨在支持鼓源分离方法的研究。 文件详解 文件名称:dreanss_v1.zip 文件格式:ZIP(.zip)...
    packageimg
  • 语音转换挑战赛2020听力测试数据集

    2025年12月22日   

    数据集概述 本数据集包含2020年语音转换挑战赛(VCC 2020)中,用于跨语言语音转换任务的众包感知评估音频文件及原始听力测试评分,支持语音转换系统性能的主观评价研究。 文件详解 文件名称: nii-yamagishilab/VCC2020-listeningtest-v1.0.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • AUGUSTA语音转文本语言模型训练数据集

    2025年12月22日   

    数据集概述 该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集,AUGUSTA是基于OpenAI Whisper定制的模型,可将南蒂罗尔方言语音转录为标准德语。 文件详解 文件名称: augusta_data-main.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • Speech_To_Docker_Based_语音转Docker指令音频完整数据

    2025年12月21日   

    数据集概述 该数据集包含12名受试者(4名女性和8名男性)朗读“text-to-docker”数据集测试样本提示词的英文语音录音,共3192个音频文件,时长约3.92小时。数据采集遵循伦理规范,已获得受试者知情同意。 文件详解 数据压缩包: data.zip: ZIP格式压缩包,包含所有加密的音频文件,需通过decrypt.py脚本解密获取原始音频...
    packageimg
  • 语音身份重建研究数据集

    2025年12月21日   

    数据集概述 本数据集为研究论文《Reconstructing Voice Identity from Noninvasive Auditory Cortex Recordings》的配套数据与代码。研究通过深度神经网络构建“语音潜在空间”,分析其与大脑活动的关联,探究听觉皮层对说话人身份信息的表征机制,并实现基于脑活动的语音身份重建。 文件详解...
    packageimg
  • 英乌语言元音音素发音特征数据集

    2025年12月21日   

    数据集概述 本数据集聚焦于英语和乌兹别克语两种语言的元音音素发音特征研究,包含一份以PDF格式呈现的相关文档,为语言语音学领域的发音特征分析提供资料支持。 文件详解 文件名称: Умаров Хамидилла Лутфуллаевич.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • Emozionalmente意大利语情感语音众包语料库

    2025年12月21日   

    数据集概述 该数据集是意大利语模拟情感语音众包语料库,包含431名业余演员录制的6902条带标签样本,覆盖愤怒、厌恶等六种基础情绪及中性状态,每条样本对应18个固定句子,标签反映演员的情感表达意图,为意大利语情感语音研究提供数据支持。 文件详解 文件名称: emozionalmente.zip 文件格式: ZIP压缩包 包含内容: 音频文件:...
    packageimg