新闻情感数据集

新闻情感数据集 数据来源:互联网公开数据 标签:新闻,情感分析,正面新闻,负面新闻,文本挖掘,社交媒体,数据分析 数据概述: 新闻情感数据集收录了过去一年间收集的新闻文章,旨在通过标记正面新闻来帮助用户筛选出积极的信息。该数据集最初只是一个简单的项目,旨在理解什么被认为是正面新闻,但很快扩展到了多种思考和数据收集过程。数据集包含正面新闻链接(从r/UpliftingNews抓取)和负面新闻链接(来源于一篇研究论文的数据集),尽管数据集存在一定的偏斜(找到实际标记为负面的文章出乎意料地困难)。 数据用途概述: 该数据集适用于新闻情感分析、舆情监测、正面内容推荐等多种场景。研究人员可以利用数据集来分析特定时期内新闻情感的分布;媒体机构可以借助数据过滤和推荐正面新闻;公众可以使用数据来更积极地看待新闻信息。此外,数据集也适合用于教育培训,帮助学习者了解新闻情感分析的基本方法和应用。 新闻标题:新闻文章的标题。 Reddit标题:如果链接是从Reddit抓取的,则为Reddit帖子的标题。 情感:0表示负面新闻,1表示正面新闻。 文本:新闻文章的全文内容。 URL:新闻文章的链接,可用于进一步提取特征。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.27 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。