Deezer社交网络数据集欧洲三国2017年11月
数据来源:互联网公开数据
标签:社交网络,Deezer,用户友谊,音乐偏好,节点分类,链接预测,社区检测,网络可视化
数据概述:
本数据集来源于音乐流媒体服务Deezer,收集时间为2017年11月,包含了来自罗马尼亚、克罗地亚和匈牙利三国用户的友谊网络信息。数据集中的节点代表用户,边表示用户之间的相互友谊关系。为了保护用户隐私,节点进行了重新索引。CSV文件中包含了边的信息,节点索引从0开始;JSON文件中包含了用户的音乐流派偏好信息,每个键对应一个用户ID,喜爱的流派以列表形式给出,流派标注在所有用户中保持一致。每个数据集中用户可以选择84种不同的流派。流派列表是根据用户喜欢的歌曲列表编译而成的。每个数据集列出了节点和边的数量,具体信息如下:罗马尼亚数据集包含41,773个节点和125,826条边,密度为0.0001,传递性为0.0752;克罗地亚数据集包含54,573个节点和498,202条边,密度为0.0004,传递性为0.1146;匈牙利数据集包含47,538个节点和222,887条边,密度为0.0002,传递性为0.0929。
数据用途概述:
该数据集适用于多种网络分析任务,包括节点分类、链接预测、社区检测和网络可视化等。研究人员可以利用该数据集进行社交网络结构的深入研究,了解不同国家用户的音乐偏好和社交模式;企业和研究机构可以利用此数据集识别潜在的市场机会和用户群体特征;教育领域也可以利用该数据集进行教学和课程设计,帮助学生理解社交网络分析的基本方法和应用。
举例:
本数据集可用于分析不同国家之间的社交网络差异,例如,可以通过比较罗马尼亚、克罗地亚和匈牙利三个国家用户的友谊网络密度和传递性,了解各国用户社交网络的紧密程度和信息传播效率。此外,研究者还可以利用数据集中的音乐偏好信息,分析不同国家用户在音乐流派方面的偏好差异,为音乐推荐系统的设计提供数据支持。