Spotify平台近十年热门歌曲音频特征数据集
数据来源:互联网公开数据
标签:Spotify,音乐,歌曲,音频特征,流媒体,数据分析,音乐推荐,情感分析,流行音乐
数据概述:
本数据集源自Spotify API,包含了近十年(具体时间范围未在原始描述中明确,此处默认为近十年)Spotify平台上热门歌曲的音频特征数据。数据涵盖了歌曲的多种维度,旨在为音乐分析和挖掘提供全面的信息。
关键字段包括:
artist_name(艺术家姓名):歌曲的演唱者。
track_id(歌曲ID):Spotify为每首歌曲提供的唯一标识符。
track_name(歌曲名称):歌曲的标题。
acousticness(声学性):衡量歌曲是否为原声的指标,取值范围0.0-1.0,值越高表示歌曲越偏向原声。
danceability(舞曲性):描述歌曲是否适合跳舞的指标,基于节奏、节拍稳定性等因素,取值范围0.0-1.0,值越高表示越适合跳舞。
duration_ms(时长):歌曲的持续时间,单位为毫秒。
energy(能量):衡量歌曲的能量强度,取值范围0.0-1.0,值越高表示歌曲越充满活力。
instrumentalness(器乐性):预测歌曲是否包含人声的指标,取值范围0.0-1.0,值越高表示歌曲越可能是纯音乐。
key(音阶):歌曲的整体调性,用整数表示,-1表示未检测到调性。
liveness(现场感):检测歌曲是否包含现场录音的指标,取值范围0.0-1.0,值越高表示歌曲越可能为现场录制。
loudness(响度):歌曲的整体响度,单位为分贝(dB)。
mode(模式):指示歌曲的调式(大调或小调),1表示大调,0表示小调。
speechiness(说话度):检测歌曲中是否包含 spoken words 的指标,取值范围0.0-1.0,值越高表示歌曲越可能包含 spoken words。
tempo(速度):歌曲的节拍速度,单位为每分钟节拍数(BPM)。
time_signature(拍号):歌曲的拍号,表示每小节的节拍数。
valence(情感值):描述歌曲传达的音乐积极性的指标,取值范围0.0-1.0,值越高表示歌曲越积极(例如,快乐、欢快),值越低表示歌曲越消极(例如,悲伤、沮丧)。
popularity(热度):歌曲的整体受欢迎程度得分,基于播放次数等因素计算,取值范围0-100,100表示最受欢迎。
数据用途概述:
该数据集可用于多种音乐相关的分析和应用,包括:
聚类分析:根据音频特征将歌曲进行分组,例如按风格、情感等进行分类。
分类分析:构建模型,根据音频特征预测歌曲的风格、流派等。
可视化:创建各种图表,探索音频特征之间的关系,例如,能量与舞曲性的关系。
探索性数据分析(EDA):深入研究数据集,发现音乐的内在规律和特征。
特征工程:根据现有特征创建新的特征,以增强模型的预测能力,例如,计算歌曲的平均响度。
音乐推荐:基于歌曲的音频特征,构建个性化的音乐推荐系统。
情感分析:分析歌曲的情感倾向,例如,识别悲伤的歌曲。
流行趋势分析:分析不同时期音乐的流行趋势和变化。