MuChoMusic音乐理解多模态评估数据集

数据集概述

该数据集是评估音频-语言多模态模型音乐理解能力的基准数据集,包含一千一百八十七道经人工验证的多选题,基于六百四十四首来自公开音乐数据集的曲目,覆盖多种音乐流派,用于测试模型对音乐概念及文化、功能语境的知识与推理能力。

文件详解

  • 文件名称: muchomusic.csv
  • 文件格式: CSV
  • 字段映射: 包含question_id(问题ID)、question(问题内容)、correct_answer(正确答案)、distractor_1_answer至distractor_3_answer(干扰选项)、dataset(来源数据集)、dataset_identifier(来源数据标识符)、num_annotations(标注数量)、correct(正确标注数)、distractor1至distractor3(干扰选项标注数)、odd_question(异常问题标识)、genr(流派信息,字段显示不完整)等
  • 文件名称: datasheet.pdf
  • 文件格式: PDF
  • 内容说明: 数据集说明书,可能包含数据集构建方法、评估指标、使用指南等背景信息

适用场景

  • 多模态模型评估: 测试音频-语言模型对音乐知识的理解与推理能力
  • 音乐AI研究: 分析模型在音乐流派、文化语境等维度的表现短板
  • 基准测试构建: 为音乐理解类AI模型提供标准化评估工具
  • 模态融合研究: 探究模型在音频与语言模态间的信息整合效率与偏差
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.32 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。