虚假新闻识别-ISOT虚假新闻数据集-islamic

虚假新闻识别-ISOT虚假新闻数据集-islamic 数据来源:互联网公开数据 标签:虚假新闻, 真实新闻, 新闻文章, 文本分类, 自然语言处理, 政治新闻, 世界新闻, 数据集, 文本分析 数据概述: 本数据集包含了来自真实新闻来源和虚假新闻来源的两种类型文章,旨在用于虚假新闻的识别与分类研究。真实新闻文章来源于路透社(Reuters.com),而虚假新闻文章则来自Politifact(美国事实核查组织)和维基百科标记的不可靠网站。数据集主要关注政治和世界新闻领域,涵盖了2016年至2017年期间的文章。

数据集包含两个CSV文件:

True.csv:包含超过12,600篇来自Reuters.com的真实新闻文章。 Fake.csv:包含超过12,600篇来自不同虚假新闻来源的文章。 每个文章都包含以下信息:文章标题、正文、类型以及发布日期。为了保持与Kaggle.com上虚假新闻数据的一致性,数据集重点收集了2016年至2017年的文章。数据经过清洗和处理,但保留了虚假新闻中存在的标点符号和错误。

数据用途概述: 该数据集适用于多种研究和应用场景,包括:

虚假新闻检测模型训练:用于训练机器学习和深度学习模型,以识别和分类虚假新闻。 文本分析研究:用于分析新闻文章的语言特征、主题分布等,以探索虚假新闻的传播规律。 自然语言处理研究:为自然语言处理领域的文本分类、情感分析等任务提供数据支持。 教育与研究:为学生和研究人员提供一个用于研究虚假新闻传播和影响的实证数据。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 40.45 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。