西班牙语自杀倾向文本数据集

西班牙语自杀倾向文本数据集

数据来源:互联网公开数据

标签:心理健康, 自杀倾向, 抑郁症, 社交媒体文本, Reddit, 情感分析, 西班牙语

数据概述:
本数据集由Reddit平台上的“SuicideWatch”和“depression”两个子论坛中的帖子组成,使用Pushshift API收集。数据集涵盖了“SuicideWatch”子论坛自2008年12月16日(创建日期)至2021年1月2日的所有帖子,以及“depression”子论坛自2009年1月1日至2021年1月2日的部分帖子。数据中的帖子被分为两类:来自“SuicideWatch”的帖子标记为“自杀倾向”,来自“depression”子论坛的帖子标记为“抑郁症”。此外,数据集中还包括从r/teenagers子论坛中收集的非自杀相关的帖子作为对比数据。整体而言,该数据集提供了丰富的文本数据,可用于分析与心理健康相关的语言模式和情感特征。

数据用途概述:
该数据集适用于心理健康研究、情感分析、自然语言处理等多个领域。研究人员可以利用这些文本数据进行情感分析,识别与自杀倾向和抑郁症相关的语言模式,从而为心理健康干预提供支持。数据集还可用于训练机器学习模型,以自动识别社交媒体中潜在的危机信号,帮助及时发现和干预心理危机。此外,数据集也适用于语言学研究,探究不同情感状态下的语言表达特征,或用于跨语言(尤其是西班牙语)的情感分析模型开发。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 22.93 MiB
最后更新 2025年4月20日
创建于 2025年4月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。