数据集概述
该数据集是用于符号音乐分类的SMCBenchmark,包含已处理为npy格式但未量化的数据。涵盖多种音乐分析任务,如流派分类、节拍预测、和弦根音识别等,每个任务对应数据文件与标签文件,为符号音乐理解研究提供标准化基准。
文件详解
数据集为一个压缩文件,具体说明如下:
- 文件名称: SMCBenchmark.zip
- 文件格式: ZIP (.zip)
- 内部文件结构: 包含对应不同任务的npy格式数据文件与标签文件,任务与文件对应关系如下:
- SGC任务: tagatraum_{train, valid, test}.npy(数据)、tagatraum_{train, valid, test}genreans.npy(标签)
- BP任务: pm2s{train, valid, test}.npy(数据)、pm2s_{train, valid, test}beatans.npy(标签)
- DbP任务: pm2s{train, valid, test}.npy(数据)、pm2s_{train, valid, test}downbeatans.npy(标签)
- CR任务: augnet{train, valid, test}.npy(数据)、augnet_{train, valid, test}chordrootans.npy(标签)
- LK任务: augnet{train, valid, test}.npy(数据)、augnet_{train, valid, test}localkeyans.npy(标签)
- ME任务: pop909{train, valid, test}.npy(数据)、pop909_{train, valid, test}melodyans.npy(标签)
- VE任务: pop909{train, valid, test}.npy(数据)、pop909_{train, valid, test}velocityans.npy(标签)
- OTC任务: orch{train, valid, test}.npy(数据)、orch_{train, valid, test}textureans.npy(标签)
- PS任务: pianist8_fold{0,1,2,3,4}.npy(数据)、pianist8_fold_{0,1,2,3,4}composerans.npy(标签)
- ER任务: emopia_fold{0,1,2,3,4}.npy(数据)、emopia_fold_{0,1,2,3,4}emotionans.npy(标签)
- VF任务: tnua{train, valid, test}.npy(数据)、tnua_{train, valid, test}violin_allans.npy(标签)
- MNID任务: bps_motif_fold{0,1,2,3,4}.npy(数据)、bps_motif_fold_{0,1,2,3,4}_mnidans.npy(标签)
- 数据字段: 数据文件中每首歌包含音符列表,每个音符以[onset(起始时间), offset(结束时间), MIDI pitch(音高)]表示;标签文件为对应任务的类别标签列表
适用场景
- 符号音乐分类模型训练与评估
- 音乐信息检索算法性能测试
- 音乐流派、节拍、和弦等特征分析研究
- 跨任务音乐智能模型泛化能力验证
- 音乐情感识别与风格迁移研究