数据集概述
本数据集包含2016年1月至2019年4月期间多源科技媒体文章的情感分析结果,采用VADER工具和共现分析方法完成。数据基于14个来源的科技媒体文章,针对社会议题与高频共现词的组合进行段落级情感评分,最终生成情感复合得分及趋势分析结果。
文件详解
- 文件名称:sentiments.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含使用VADER工具分析得到的情感数据,核心内容包括各社会议题与共现词组合的平均情感复合得分(范围-1至+1)、30个最积极和30个最消极共现词的示例表格,以及社会议题情感趋势演变图表。
数据来源
未提供具体机构来源,数据基于Euractiv、The Conversation、Politico Europe等14个科技媒体来源的文章
适用场景
- 科技媒体情感趋势研究: 分析2016-2019年科技媒体对特定社会议题的情感倾向演变规律
- 自然语言处理模型验证: 作为测试数据验证VADER等情感分析工具在科技文本领域的适用性
- 科技传播效果评估: 研究不同科技媒体来源对同类议题的情感表达差异及传播影响力
- 共现词情感关联分析: 探索科技领域社会议题与高频词汇的情感关联模式,辅助舆情监测
- 科技政策舆情分析: 为科技相关政策制定提供媒体情感倾向的实证数据支持