数据集

政治言论真伪性分析数据集PoliticalStatementsVeracityAnalysisDataset-bandimohitha

数据来源：互联网公开数据

标签：政治言论, 事实核查, 文本分类, 真伪判断, 政治, 舆情分析, 数据标注, 机器学习

数据概述：该数据集包含来自公开渠道的政治人物言论，并附有关于其真实性的标注信息。主要特征如下：时间跨度：数据未明确标注时间范围，但可推测为某一时期内的政治言论集合。地理范围：数据主要聚焦于美国政治环境下的言论。数据维度：数据集包括ID、json-label（真伪标签，如TRUE, FALSE等）、statement（言论内容）、subject(s)（言论主题）、speaker（发言人）、speaker's job title（发言人职位）、state info（州信息）、party affiliation（政党派别）、barely true counts（勉强真实计数）、false counts（虚假计数）、half true counts（半真计数）、mostly true counts（基本真实计数）、pants on fire counts（彻头彻尾的谎言计数）、venue（言论发布场所）等字段。数据格式：CSV格式，文件名为Liar_Dataset.csv，方便数据分析与处理。来源信息：数据来源于事实核查项目，对政治言论进行了人工标注。该数据集适合用于事实核查、文本分类、舆情分析等研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于政治学、传播学、计算机科学等领域的研究，如政治言论的真伪性分析、观点挖掘、情感分析等。行业应用：可以为新闻媒体、社交平台等提供数据支持，用于自动事实核查、虚假信息检测。决策支持：支持政府部门、公共机构等进行舆情监测，辅助制定政策和应对公共事件。教育和培训：作为数据分析、机器学习、自然语言处理等课程的实训材料，帮助学生了解真实世界的数据应用案例。此数据集特别适合用于研究政治言论的特点、分析其真伪性，并构建自动化的事实核查系统，以提高信息传播的透明度和可信度。

数据与资源

versions_20250401044347.zipZIP
0.98 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.98 MiB
最后更新	2025年5月1日
创建于	2025年5月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。