DLfM2018京剧演唱评估实验数据集补充材料

本数据集是DLfM 2018论文投稿的实验补充材料，核心为京剧独唱语音扩展数据集，支撑音素级演唱发音与整体质量自动评估研究，包含数据集拆分、特征列表、模型训练文件及预训练模型等内容。

数据集结构与统计文件:
dlfm_experiment_dataset_file_list.ods: ODS格式，记录训练、验证、测试集的录音文件名拆分
dlfm_experiment_dataset_phoneme_numbers.ods: ODS格式，统计各音素类别在训练、验证、测试集的数量
freesound_extractor_feature_list.ods: ODS格式，ANOVA特征分析中使用的freesoundExtractor特征名称列表
模型训练相关文件:
log-mel-scaler-keys-label-encoder.zip: ZIP格式，嵌入模型训练所需文件，含对数特征、特征缩放器、音素字典键、标签编码器
pretrained_embedding_models.zip: ZIP格式，基于相关数据集预训练的分类嵌入模型包
特征分析文件:
anova_analysis_essentia_feature.zip: ZIP格式，用于ANOVA分析的各音素Essentia freesoundExtractor特征

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	492.06 MiB
最后更新	2025年12月15日
创建于	2025年12月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。