数据集概述
本数据集整合了世界各地不同艺术家歌曲在Spotify和YouTube两大平台的综合统计信息。数据集涵盖20,718首歌曲,包含艺术家信息、音轨特征、专辑详情以及跨平台表现数据,为音乐行业分析、流媒体研究和商业决策提供了丰富的数据基础。
数据字段定义
基础信息字段:
- Artist:艺术家名称
- Track:歌曲名称
- Album:专辑名称
- Album_type:专辑类型(单曲/专辑/合辑)
- Uri:Spotify统一资源标识符
音频特征字段:
- Danceability:舞蹈性(0-1)
- Energy:能量值(0-1)
- Key:调性(0-11)
- Loudness:响度(分贝值)
- Speechiness:语音性(0-1)
- Acousticness:声学性(0-1)
- Instrumentalness:器乐性(0-1)
- Liveness:现场感(0-1)
- Valence:情绪价值(0-1)
- Tempo:节拍(BPM)
- Duration_ms:时长(毫秒)
Spotify数据字段:
- Url_spotify:Spotify链接
- Stream:流媒体播放次数
YouTube数据字段:
- Url_youtube:YouTube链接
- Title:视频标题
- Channel:频道名称
- Views:观看次数
- Likes:点赞数
- Comments:评论数
- Description:视频描述
- Licensed:是否授权
- official_video:是否官方视频
数据特征
- 数据规模:20,718行,28列,文件大小29.4MB
- 数据质量:整体缺失率仅0.93%,数据完整性良好
- 涵盖艺术家:2,079位不同艺术家
- 歌曲覆盖:17,841首不同曲目
- 专辑数量:11,937张专辑
适用场景
- 音乐产业分析:研究不同音频特征对歌曲流行度的影响
- 平台表现对比:分析Spotify和YouTube平台间的关联性
- 艺术家研究:评估艺术家的跨平台影响力和受众覆盖
- 市场趋势分析:识别音乐偏好和消费模式
- 推荐算法研究:基于音频特征构建音乐推荐模型
- 商业决策支持:为唱片公司、艺术家经纪提供数据支撑