Reddit音乐分享与抑郁情绪关联数据集
数据来源:互联网公开数据
标签:音乐,Reddit,抑郁,情绪,社交媒体,文本分析,健康,心理学,数据挖掘
数据概述:
本数据集收录了Reddit平台上关于音乐分享行为与抑郁情绪关联的数据。数据集包含两个主要组成部分:songs.csv文件和clustered_posts文件夹。
songs.csv文件包含了用于音乐分析的歌曲信息,主要字段包括:
* Comment/Title for context:Reddit帖子的标题或评论,提供上下文信息
* Spotify track:Spotify上对应歌曲的链接
* Context:分享文本的上下文环境
* Listening strategy:手动标注的听歌策略,H代表健康,U代表不健康
clustered_posts文件夹包含了根据主题建模pipeline组织成的文本文件,按主题聚类。每个文本文件代表一个聚类,包含了属于该聚类的相关句子。该文件夹下又细分为5个子目录:
* healthy_listening_strategies:包含11个文件,代表被识别为健康听歌策略的聚类
* unhealthy_listening_strategies:包含8个文件,代表被识别为不健康听歌策略的聚类
* musical_anhedonia:包含3个文件,代表音乐快感缺失相关的聚类
* Musical_seeking:包含4个文件,代表音乐寻求相关的聚类
* miscellaneous:包含19个聚类文件,代表其他类别。还包含一个名为index.csv的文件,提供了关于所有杂项聚类的更详细信息。
数据用途概述:
该数据集适用于研究社交媒体上音乐分享行为与情绪状态之间的关系。研究人员可以使用该数据分析用户在不同情绪状态下分享的音乐类型、听歌方式,以及讨论内容。具体应用场景包括:
* 分析音乐在缓解或加剧抑郁情绪中的作用
* 探索健康和不健康的听歌策略
* 识别与音乐相关的心理健康问题
* 开发基于音乐的心理健康干预措施
* 研究社交媒体用户的情感表达和行为模式