南印度音乐主音识别数据集_音频

数据集概述

该数据集是针对南印度古典音乐(卡纳提克音乐)的主音识别音频数据集,系统收集了以四种常用主音(F#、G、G#、A)分类的声乐片段,包含音频文件及对应的元数据与主音标注,可支持主音识别模型训练及音乐学习应用。

文件详解

  • 压缩音频文件:
  • 文件名称: Carnatic_Dataset_Snippets.zip
  • 文件格式: ZIP
  • 内容说明: 包含4个按主音命名的子文件夹(如"F#"),每个子文件夹内是20秒的卡纳提克音乐片段(MP3格式),命名规则为{songName}_{tonic}_chunk{number}.mp3,总计1027个片段(F#:300个、G:207个、G#:240个、A:280个)
  • 元数据标注文件:
  • 文件名称: Carnatic_Dataset.csv
  • 文件格式: CSV
  • 字段说明:
  • File_Name: 音频片段的文件路径(如Carnatic_Dataset_Snippets/F#/Raravenu_F#_chunk0.mp3)
  • Tonic: 主音标注(包含卡纳提克音乐术语Kattai,如F#3 Scale (4.5 Kattai))

适用场景

  • 音乐信息检索研究: 训练卡纳提克音乐主音识别的分类或预测模型
  • 音乐教育应用: 帮助音乐学习者测试音高、选择适合的演唱主音
  • 音乐学分析: 研究南印度古典音乐中主音的使用规律与分布特征
  • 音频处理技术验证: 用于音频特征提取、音高检测等算法的性能测试
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 147.68 MiB
最后更新 2025年11月30日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。