社交媒体成瘾文本特征分析数据集SocialMediaAddictionTextFeatureAnalysisDataset-jejejamal
数据来源:互联网公开数据
标签:社交媒体, 成瘾行为, 文本分析, 情感分析, 计量语言学, 自然语言处理, 机器学习, 心理健康
数据概述:
该数据集包含来自Reddit论坛的数据,记录了与社交媒体成瘾相关的文本特征。主要特征如下:
时间跨度:数据主要来源于2019年。
地理范围:数据来源于Reddit论坛,覆盖范围广泛,但具体地理位置未明确。
数据维度:数据集包括多个文本特征,如:subreddit(子版块), author(作者), date(日期), post(帖子内容), 以及各种文本统计指标,包括自动化可读性指数、Coleman-Liau指数、Flesch-Kincaid年级水平、Flesch阅读难易度、Gulpease指数、Gunning雾指数、LIX、SMOG指数、维也纳Sachtextformel、字符数、长词数、单音节词数、多音节词数、句子数、音节数、独特词数、总词数、情感得分(负面、中性、正面、复合)、经济压力总分、隔离总分、物质使用总分、枪支总分、家庭压力总分、自杀倾向总分、标点符号使用、以及LIWC(语言调查和字数统计)分析结果,包括第一人称、第二人称、第三人称、成就、副词、情感过程、愤怒、焦虑、冠词、同意、助动词、生物、身体、因果关系等。
数据格式:CSV格式,文件名为addiction_2019_features_tfidf_256.csv,便于数据分析和建模。
来源信息:数据来源于Reddit论坛,并经过文本特征提取和计算。该数据集适合用于社交媒体成瘾行为的研究和文本分析。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于心理学、社会学和计算机科学等领域的学术研究,如社交媒体成瘾行为的文本特征分析、情感分析、文本内容与心理健康的关系研究等。
行业应用:可以为社交媒体平台、心理健康咨询机构等提供数据支持,尤其是在用户行为分析、风险预警、内容审核等领域。
决策支持:支持社交媒体平台的用户行为分析,风险评估以及内容推荐策略的优化。
教育和培训:作为心理学、社会学和自然语言处理等课程的辅助材料,帮助学生和研究人员深入理解社交媒体成瘾行为。
此数据集特别适合用于探索社交媒体使用与心理健康之间的关系,以及识别与成瘾行为相关的文本特征,帮助用户实现对社交媒体成瘾行为的深入理解和干预。