数据集

政治新闻虚假信息识别数据集PoliticalNewsFakeInformationIdentificationDataset-virenkathiriya

数据来源：互联网公开数据

标签：虚假新闻, 政治新闻, 文本分析, 事实核查, 自然语言处理, 舆情分析, 数据挖掘, 机器学习

数据概述：该数据集包含来自政治新闻网站的数据，记录了新闻文章及其相关元数据，用于识别虚假信息。主要特征如下：时间跨度：数据未明确标注具体时间范围，但从发布日期字段推断，数据涵盖了新闻文章的发布时间。地理范围：数据来源于新闻网站，内容涉及政治和社会议题，覆盖范围主要为美国。数据维度：数据集包括多个字段，如作者、文章链接、是否包含关键词、图片、是否为虚假信息（is_fake，布尔值）、关键词、发布日期、来源网站、文章摘要、正文、标题、文本字数统计、情感分析得分、链接可信度评分等。数据格式：CSV格式，文件名为Politifact_.csv，便于数据分析和处理。来源信息：数据来源于政治新闻网站，已进行结构化处理，并包含了文章的各种特征信息。该数据集适合用于虚假信息检测、新闻内容分析、情感分析和自然语言处理等领域的研究与应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于虚假信息传播、政治新闻分析、舆情分析等领域的学术研究，如虚假信息检测模型构建、新闻内容情感分析、作者可信度评估等。行业应用：可以为新闻媒体、社交平台、内容审核机构提供数据支持，特别是在自动化内容审核、虚假信息过滤、舆情监控等方面。决策支持：支持政府机构、社会组织等进行舆情分析、风险评估，辅助制定应对虚假信息的策略。教育和培训：作为自然语言处理、机器学习等课程的实训数据，帮助学生和研究人员理解虚假信息识别的原理和方法。此数据集特别适合用于研究虚假信息在政治新闻中的传播规律，以及构建基于文本特征的虚假信息检测模型，从而提高信息传播的真实性和可靠性。

数据与资源

政治新闻虚假信息识别数据集PoliticalNewsFakeInformationIdenti...ZIP
4.65 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	4.65 MiB
最后更新	2025年5月19日
创建于	2025年5月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

政治新闻虚假信息识别数据集PoliticalNewsFakeInformationIdentificationDataset-virenkathiriya

数据与资源

附加信息

注册成功！