MuMu多模态音乐多标签分类数据集

数据集概述

该数据集是融合亚马逊评论数据集与百万歌曲数据集(MSD)的多模态音乐数据集,通过MusicBrainz完成映射,包含十四万七千二百九十五首歌曲、三万一千四百七十一专辑及四十四万七千五百八十三条用户评论,提供多标签流派标注、专辑元数据、评论信息等,用于多标签音乐流派分类研究。

文件详解

  • 文档文件:
  • README.txt:文本格式,介绍数据集构建背景、内容及使用说明
  • 压缩文件:
  • ismir-data-updated.zip:压缩格式,包含ISMIR多标签分类实验的数据拆分及多模态特征嵌入
  • MuMu_dataset.tar.gz:压缩格式,包含数据集映射、元数据、标注及文本评论
  • 数据文件:
  • MuMu_dataset_multi-label_splits_250.tsv:TSV格式,包含专辑、歌曲ID及多标签流派标注(如Vocal Jazz、Jazz等)
  • genre_labels_MuMu.tsv:TSV格式,包含流派标签列表(如Acid Jazz、Acoustic Blues等)

数据来源

  • 亚马逊评论数据集(Amazon Reviews dataset)
  • 百万歌曲数据集(Million Song Dataset, MSD)
  • MusicBrainz

适用场景

  • 音乐信息检索研究:用于多标签音乐流派分类实验
  • 多模态数据融合分析:探索文本评论、音频特征与元数据的联合应用
  • 推荐系统开发:基于用户评论与音乐特征的个性化音乐推荐研究
  • 自然语言处理应用:分析音乐评论的情感倾向与有用性评分关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 683.78 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。