Spotify全球热门单曲排行榜数据分析数据集-2017年1月1日至2023年5月29日
数据来源:互联网公开数据
标签:Spotify,音乐排行榜,热门歌曲,流媒体,音频特征,歌曲分析,艺术家,全球音乐,时间序列,数据分析
数据概述:
本数据集包含了2017年1月1日至2023年5月29日期间Spotify发布的全球“Top 200”热门歌曲排行榜的完整数据。该数据集涵盖了超过65万行数据,共包含467800首歌曲。数据来源于Spotify的区域排行榜数据,并经过了大量的信息补充和增强。
数据集包含以下关键信息:
歌曲排名
歌曲标题
艺术家姓名
日期
艺术家国籍
艺术家所属洲
歌曲唯一ID
歌曲URL链接
此外,数据集还利用Spotify API提取了每首歌曲的音频特征,包括:
舞动性(Danceability):描述歌曲适合跳舞的程度
能量(Energy):代表歌曲的强度和活跃度
响度(Loudness):歌曲的整体响度,单位为分贝(dB)
说话性(Speechiness):检测歌曲中是否存在人声
声学性(Acousticness):描述歌曲是否主要使用声学乐器
器乐性(Instrumentalness):预测歌曲是否包含人声
情绪(Valence):描述歌曲的音乐积极性
为了进一步增强数据集的价值,还整合了一个自定义的排名系统,根据歌曲在原始排行榜中的位置为每首歌曲分配分数。评分系统如下:
排行榜中排名第一的歌曲(该数据集涵盖了2339个排行榜)获得200分
排名第二的歌曲获得199分
…
排名第200的歌曲获得1分
此外,还添加了一个艺术家特定积分分配列。如果一首歌曲是多位艺术家的合作,并获得了特定排名,则每个艺术家将获得相等份额的积分。例如,如果一首歌曲排名第一,并涉及两位艺术家,则每位艺术家将获得100分。
该数据集包含21个信息丰富的列,经过精心清理,可用于分析。使用此数据集进行深入分析的可能性非常广泛。
数据用途概述:
该数据集适用于多种音乐趋势分析、艺术家表现评估、歌曲特征研究等场景。研究人员可以利用此数据分析不同年份、不同国家/地区的音乐流行趋势;音乐爱好者可以探索歌曲的音频特征与其受欢迎程度之间的关系;市场分析师可以研究音乐市场的发展变化,以及Spotify平台的竞争格局。此外,该数据集也适合用于构建推荐系统,帮助用户发现新的音乐。