Spotify音乐推荐竞赛预处理数据集-2021

Spotify音乐推荐竞赛预处理数据集-2021 数据来源:互联网公开数据 标签:Spotify,音乐推荐,机器学习,竞赛数据,数据预处理,用户特征,艺术家特征,播放列表特征

数据概述: 本数据集包含为Spotify推荐竞赛(CMC ML)预处理后的数据,旨在解决原始数据混乱且难以用于模型训练的问题。数据集作为整个竞赛期间的主要训练数据源,通过整合播放列表、艺术家和用户特征,构建了全面的训练和测试数据集。主要特征文件包括playlist_group.csv、artist_group.csv和user_group.csv,通过对应的ID与这些数据框进行连接,形成完整的数据集。特征命名遵循列名__聚合方式_按_基准列的格式。

新特征描述: artist_id:每个曲目的最流行艺术家(即该艺术家所有曲目平均流行度最高的艺术家)。 user_id:每个播放列表中最常见的用户。

数据用途概述: 该数据集适用于机器学习模型训练、音乐推荐系统的开发及优化、数据可视化和分析等多种场景。研究人员和开发人员可以利用此数据集构建和评估推荐算法,更好地理解用户偏好和音乐艺术家的流行趋势。对于参赛者而言,数据集提供了结构化的训练数据,有助于提高模型性能并参与竞赛。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 30, 2025, 20:25 (UTC)
创建于 五月 30, 2025, 20:23 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。