孟加拉语语音识别模型评估数据集BengaliSpeechRecognitionModelEvaluationDataset-mbmmurad

孟加拉语语音识别模型评估数据集BengaliSpeechRecognitionModelEvaluationDataset-mbmmurad

数据来源:互联网公开数据

标签:语音识别, 孟加拉语, 语音转录, 文本校对, 模型评估, 语言学, 机器学习, 语音数据

数据概述: 该数据集包含来自Common Voice项目的孟加拉语语音数据,记录了语音样本及其对应的文本转录,以及两种不同语音识别模型(Google和Yellowking)的预测结果和评估指标。主要特征如下: 时间跨度:数据未明确标注时间,但来源于Common Voice 12.0版本,发布于2022年12月。 地理范围:数据主要针对孟加拉语的使用者,可能涵盖孟加拉国及周边地区。 数据维度:数据集包括以下关键字段: id: 语音样本的唯一标识符。 filename: 语音文件的名称。 client_id: 录音者的身份标识。 ggl_cer, ggl_mer, ggl_wer, ggl_wil, ggl_wip: Google模型的字符错误率(CER)、词错误率(MER)、词错误率(WER)、词内相似度(WIL)、词内预测(WIP)等评估指标。 google_preds: Google模型的语音转录预测结果。 path: 语音文件在原始数据集中的路径。 sentence: 语音样本对应的标准文本转录。 yellowking_preds: Yellowking模型的语音转录预测结果。 ykg_mer, ykg_wer, ykg_wil, ykg_wip, ykg_cer: Yellowking模型的评估指标,与Google模型类似。 数据格式:CSV格式,文件名为train_metadata_corrected.csv,方便数据读取和分析。 数据来源:来源于Common Voice项目,已进行语音数据和文本的配对,并整合了两种不同模型的预测结果和评估指标。 该数据集适合用于孟加拉语语音识别模型的性能评估、错误分析和模型比较。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于语音识别、自然语言处理等相关领域的学术研究,例如不同语音识别模型的比较分析、错误类型分析、以及针对孟加拉语的语言学研究。 行业应用:可以为语音识别技术在孟加拉语环境下的应用提供数据支持,如语音助手、语音输入法、语音转文本应用等。 决策支持:为语音识别技术的改进和优化提供数据支撑,帮助开发者提升模型性能。 教育和培训:作为语音识别、机器学习等课程的实训材料,帮助学生深入理解语音识别技术。 此数据集特别适合用于评估不同语音识别模型在孟加拉语环境下的表现,分析模型错误,并探索提升语音识别准确率的方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 13, 2025, 23:11 (UTC)
创建于 五月 13, 2025, 22:51 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。