DLfM2018京剧演唱评估实验数据集补充材料

数据集概述

本数据集是DLfM 2018论文投稿的实验补充材料,核心为京剧独唱语音扩展数据集,支撑音素级演唱发音与整体质量自动评估研究,包含数据集拆分、特征列表、模型训练文件及预训练模型等内容。

文件详解

  • 数据集结构与统计文件:
  • dlfm_experiment_dataset_file_list.ods: ODS格式,记录训练、验证、测试集的录音文件名拆分
  • dlfm_experiment_dataset_phoneme_numbers.ods: ODS格式,统计各音素类别在训练、验证、测试集的数量
  • freesound_extractor_feature_list.ods: ODS格式,ANOVA特征分析中使用的freesoundExtractor特征名称列表
  • 模型训练相关文件:
  • log-mel-scaler-keys-label-encoder.zip: ZIP格式,嵌入模型训练所需文件,含对数特征、特征缩放器、音素字典键、标签编码器
  • pretrained_embedding_models.zip: ZIP格式,基于相关数据集预训练的分类嵌入模型包
  • 特征分析文件:
  • anova_analysis_essentia_feature.zip: ZIP格式,用于ANOVA分析的各音素Essentia freesoundExtractor特征

数据来源

京剧独唱语音音频数据集(含三部分): - Part 1: https://doi.org/10.5281/zenodo.780559 - Part 2: https://doi.org/10.5281/zenodo.842229 - Part 3: https://doi.org/10.5281/zenodo.1244732

适用场景

  • 京剧演唱质量评估研究:用于音素级发音准确性与整体演唱质量的自动评估模型开发
  • 音频特征分析:基于ANOVA方法筛选京剧演唱语音的关键声学特征
  • 音乐信息检索:支撑京剧语音嵌入模型的训练与预训练模型应用研究
  • 传统戏曲数字化:为京剧语音数据的结构化处理与智能分析提供数据基础
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 492.06 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。