SketchSynth音频素描语义提示映射研究数据集

数据集概述

本数据集包含62名参与者针对三组语义提示对(嘈杂-平静、单薄-厚重、清晰-粗糙)生成的声音草图数据,同时涵盖栅格化草图、预测声音及参与者评分,用于研究声音与视觉草图的语义映射关系。

文件详解

  • 原始草图文件
  • 文件名称:raw_sketches.json
  • 文件格式:JSON
  • 字段映射介绍:以参与者ID为顶级键,每个参与者包含对应语义提示对的草图数据;草图数据为数组结构,每个笔画包含x坐标、y坐标、时间戳三个子数组
  • 压缩包文件
  • 文件名称:Rasterised Images - Sound Predictions - Participant Ratings.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含栅格化处理后的参与者草图图像、基于草图生成的预测声音文件、参与者对声音的评分数据

适用场景

  • 音频-视觉语义映射研究:分析声音特征与视觉草图元素的对应关系
  • 用户交互设计:探索基于草图的声音生成界面设计逻辑
  • 多媒体人工智能训练:用于训练声音草图识别与声音生成模型
  • 认知心理学研究:研究人类对声音语义的视觉表达模式
  • 音频标注工具开发:为声音属性标注提供用户行为数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 35.24 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。