数据集概述
本数据集包含两个Excel文件及相关文档、代码,核心为社交媒体心理健康评论标注数据。数据源自Instagram平台名人心理健康披露相关帖子的评论,共2287条,分别标注了极性、污名属性及情感类别,同时提供机器学习分类模型代码,支持社交媒体心理健康相关文本分析研究。
文件详解
- 数据文件
- 文件名称:DatasetMH.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含2287条社交媒体评论,标注字段包括极性(positive/negative/neutral)、污名属性(是否含污名化内容)
- 文件名称:DatasetMH_Emotions.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含2287条社交媒体评论,标注字段为情感类别(Love/admiration、Gratitude、Comprehension/empathy/identification、Sadness、Anger/contempt/mockery、Neutral)
- 文档文件
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:数据集说明文档,涵盖数据内容、标注规则、文件结构等信息
- 文件名称:DecalogoEtiquetadoEmociones.docx
- 文件格式:DOCX
- 字段映射介绍:情感标注规则文档(西班牙语)
- 文件名称:DecalogueLabellingEmotions.docx
- 文件格式:DOCX
- 字段映射介绍:情感标注规则文档(英语)
- 代码文件
- 文件名称:RF_Emotions.ipynb
- 文件格式:IPYNB
- 字段映射介绍:基于随机森林算法的情感分类模型代码
- 文件名称:BERT_Emotions.ipynb
- 文件格式:IPYNB
- 字段映射介绍:基于BERT模型的情感分类模型代码
- 文件名称:DeepLearning_Emotions.ipynb
- 文件格式:IPYNB
- 字段映射介绍:基于深度学习的情感分类模型代码
适用场景
- 社交媒体心理健康文本极性分析: 利用极性标注数据研究公众对名人心理健康披露的态度倾向
- 心理健康污名化识别研究: 通过污名属性标注数据分析社交媒体中心理健康污名化的表现形式与传播特征
- 情感分类模型训练与验证: 使用情感标注数据训练和评估机器学习模型对社交媒体文本情感的分类能力
- 心理健康内容传播效果分析: 结合情感、极性数据探究名人心理健康披露内容在社交媒体中的公众反馈机制
- 跨语言标注规则对比研究: 通过西班牙语与英语标注规则文档,分析不同语言环境下情感标注的差异与一致性