数据集

Spotify音乐推荐竞赛预处理数据集-2021

Spotify音乐推荐竞赛预处理数据集-2021 数据来源：互联网公开数据标签：Spotify,音乐推荐,机器学习,竞赛数据,数据预处理,用户特征,艺术家特征,播放列表特征

数据概述：本数据集包含为Spotify推荐竞赛（CMC ML）预处理后的数据，旨在解决原始数据混乱且难以用于模型训练的问题。数据集作为整个竞赛期间的主要训练数据源，通过整合播放列表、艺术家和用户特征，构建了全面的训练和测试数据集。主要特征文件包括playlist_group.csv、artist_group.csv和user_group.csv，通过对应的ID与这些数据框进行连接，形成完整的数据集。特征命名遵循列名__聚合方式_按_基准列的格式。

新特征描述： artist_id：每个曲目的最流行艺术家（即该艺术家所有曲目平均流行度最高的艺术家）。 user_id：每个播放列表中最常见的用户。

数据用途概述：该数据集适用于机器学习模型训练、音乐推荐系统的开发及优化、数据可视化和分析等多种场景。研究人员和开发人员可以利用此数据集构建和评估推荐算法，更好地理解用户偏好和音乐艺术家的流行趋势。对于参赛者而言，数据集提供了结构化的训练数据，有助于提高模型性能并参与竞赛。

数据与资源

Spotify音乐推荐竞赛预处理数据集-2021.zipZIP
343.70 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	343.7 MiB
最后更新	2025年5月30日
创建于	2025年5月30日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

Spotify音乐推荐竞赛预处理数据集-2021

数据与资源

附加信息

注册成功！