数据集

政治新闻真伪识别数据集PoliticalNewsFact-CheckingDataset-tonmoydutta

数据来源：互联网公开数据

标签：新闻真伪, 文本分类, 政治新闻, 自然语言处理, 机器学习, 情感分析, 数据标注, 舆情分析

数据概述：该数据集包含来自互联网的新闻文章，记录了政治新闻的标题、正文、主题和发布日期，并区分为“真”和“假”两类，用于新闻真伪识别与分析。主要特征如下：时间跨度：数据未明确标注具体时间，但根据内容推测可能涵盖了特定时期的政治新闻。地理范围：数据主要关注政治新闻，未明确标注地理范围，但新闻主题可能涉及全球政治事件。数据维度：数据集包含“title”（标题）、“text”（正文）、“subject”（主题）、“date”（日期）等字段，以及“Fake.csv”与“True.csv”两个文件分别存储了虚假新闻和真实新闻的数据。数据格式：CSV格式，分为“Fake.csv”和“True.csv”两个文件，便于文本处理和机器学习模型构建。其中“Fake.csv”包含多个“Unnamed”列，可能由于数据处理或导出过程中产生。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、文本挖掘、机器学习等领域的学术研究，如虚假信息检测、情感分析、新闻主题分类等。行业应用：为新闻媒体、社交平台、内容审核机构提供数据支持，尤其在自动化新闻真伪识别、舆情监控、内容过滤等方面具有实用价值。决策支持：支持政府部门、企业等机构进行舆情分析、风险评估，辅助决策制定和危机管理。教育和培训：作为自然语言处理、机器学习、数据科学等相关课程的实训素材，帮助学生和研究人员理解文本分类、情感分析等技术。此数据集特别适合用于探索新闻文本特征与真伪之间的关系，构建新闻真伪识别模型，提升信息过滤和内容审核的效率。

数据与资源

政治新闻真伪识别数据集PoliticalNewsFact-CheckingDataset-to...ZIP
40.65 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	40.65 MiB
最后更新	2025年5月16日
创建于	2025年5月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。