WELFake虚假新闻文本分类数据集-studymart

WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述: 本数据集WELFake汇集了72,134篇新闻文章,用于虚假新闻检测研究。数据集包含35,028篇真实新闻和37,106篇虚假新闻,涵盖了广泛的新闻主题。为了提高模型的泛化能力并提供更丰富的数据用于机器学习训练,该数据集整合了Kaggle、McIntire、Reuters和BuzzFeed Political四个流行的新闻数据集。 数据集包含四个字段:序号(从0开始)、标题(新闻标题)、文本(新闻内容)和标签(0表示虚假新闻,1表示真实新闻)。原始CSV文件包含78,098条数据,但数据框中实际访问了72,134条数据。 数据用途概述: 该数据集主要用于训练和评估虚假新闻检测模型。研究人员可以使用该数据集开发和测试各种文本分类算法,包括但不限于基于机器学习和深度学习的方法。该数据集也适用于自然语言处理、文本挖掘等领域的研究,以及用于教育和培训,帮助学习者了解虚假新闻的特征和检测方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 91.13 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。