数据集

孟加拉语语音质量评估数据集BengaliSpeechQualityAssessmentDataset-mk12356

数据来源：互联网公开数据

标签：语音质量评估, 孟加拉语, 语音识别, MOS评分, 噪声, 失真, 语音合成, 声学建模

数据概述：该数据集包含来自语音合成和语音处理项目的数据，记录了孟加拉语语音的质量评估结果。主要特征如下：时间跨度：数据未明确标注具体时间。地理范围：数据主要针对孟加拉语语音，可能包含孟加拉国及周边地区的语音样本。数据维度：数据集包括以下字段：id（唯一标识符），sentence（孟加拉语文本），split（数据集划分，train/valid/test），normalized（标准化后的文本），client_id（客户端标识），ggl_cer（谷歌字符错误率），mos_pred（平均意见得分预测值，MOS），noi_pred（噪声预测值），dis_pred（失真预测值），col_pred（颜色预测值），loud_pred（响度预测值），model（语音模型）。数据格式：CSV格式，包含train.csv、valid.csv和test.csv三个文件，分别对应训练集、验证集和测试集。数据经过标准化处理，便于语音质量评估和模型训练。该数据集适合用于语音质量评估、语音合成、语音识别和声学建模等研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于语音质量评估、语音合成、语音识别等领域的学术研究，如不同语音模型、噪声环境下的语音质量评估研究。行业应用：为语音技术相关行业提供数据支持，特别是在语音助手、语音交互系统、语音转文本（STT）等产品中，用于提升孟加拉语语音处理的性能。决策支持：支持语音技术相关的产品研发和优化，促进语音技术的改进和创新。教育和培训：作为语音处理、机器学习等课程的辅助材料，帮助学生和研究人员深入理解语音质量评估方法。此数据集特别适合用于研究孟加拉语语音在不同条件下的质量表现，帮助用户开发和改进语音处理模型，提高语音识别的准确性和用户体验。

数据与资源

孟加拉语语音质量评估数据集BengaliSpeechQualityAssessmentData...ZIP
73.37 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	73.37 MiB
最后更新	2025年5月8日
创建于	2025年5月6日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

孟加拉语语音质量评估数据集BengaliSpeechQualityAssessmentDataset-mk12356

数据与资源

附加信息

注册成功！