Spotify1920-2020年歌曲特征数据集-javivaleiras
数据来源:互联网公开数据
标签:Spotify,音乐,歌曲特征,数据分析,音频特征,流行度,时间序列,艺术家,歌曲分类
数据概述:
本数据集收录了1920年至2020年间Spotify平台上的2万首歌曲的相关特征数据。数据集涵盖了歌曲的基本信息、音频特征、流行度和发行日期等关键要素,为音乐分析、推荐系统开发等应用场景提供了丰富的数据支持。
数据集中的数值型字段包括:
- acousticness: 歌曲的 acousticness 值,表示歌曲的 acousticness 程度(范围从0到1)
- danceability: 歌曲的 danceability 值,表示歌曲的可舞动性(范围从0到1)
- energy: 歌曲的 energy 值,表示歌曲的能量和活动性(范围从0到1)
- duration_ms: 歌曲的持续时间(单位:毫秒)
- instrumentalness: 歌曲的 instrumentalness 值,表示歌曲中人声部分的比例(范围从0到1)
- valence: 歌曲的 valence 值,表示歌曲的音调积极程度(范围从0到1)
- popularity: 歌曲的 popularity 值,表示歌曲的流行程度(范围从0到100)
- tempo: 歌曲的 tempo 值,表示歌曲的 BPM(每分钟节拍数)
- liveness: 歌曲的 liveness 值,表示歌曲可能是现场录制的概率(范围从0到1)
- loudness: 歌曲的 loudness 值,表示歌曲的音量(单位:分贝)
- speechiness: 歌曲的 speechiness 值,表示歌曲中对话或独白的比例(范围从0到1)
数据集中的哑元型字段包括:
- mode: 歌曲的调式(0 = 小调,1 = 大调)
- explicit: 歌曲是否包含显式内容(0 = 无,1 = 有)
数据集中的分类型字段包括:
- key: 歌曲的调性(数值编码,0 = C,1 = C,2 = D,...,11 = B)
- timesignature: 歌曲的时间签名
- artists: 歌曲的艺术家列表
- id_artists: 歌曲艺术家的ID列表
- release_date: 歌曲的发行日期
- name: 歌曲名称
- id: 歌曲在 Spotify 上的唯一 ID
数据用途概述:
该数据集适用于音乐趋势分析、歌曲推荐系统开发、艺术家表现评估、音乐风格研究等多种场景。研究人员可以利用这些数据来探索音乐市场的变化趋势,优化推荐算法以提高用户体验;艺术家可以分析数据以了解听众偏好,改进自己的作品;音乐出版商可以利用数据评估艺术家的市场潜力。此外,数据集也适合用于教育和培训,帮助学习者理解音乐特征分析的基本方法和工具。