政治言论真实性评估数据集PoliticalStatementsTruthfulnessAssessment-karthikeyanmsk
数据来源:互联网公开数据
标签:政治言论, 事实核查, 文本分类, 真实性评估, 政治分析, 舆情分析, 数据标注, 机器学习
数据概述:
该数据集包含来自Politifact网站的政治言论,记录了关于政治人物和机构的陈述,并标注了其真实性。主要特征如下:
时间跨度:数据未标明具体时间,视作静态语料数据集使用。
地理范围:数据主要涉及美国政治言论,涵盖各州政治人物和事件。
数据维度:包括多种字段,如id(唯一标识符)、label(真实性标签,如“false”、“half-true”等)、statement(陈述内容)、subject(主题)、speaker(发言人)、job(职位)、state_info(州信息)、party_affiliation(政党)、barely_true(勉强真实)、false(虚假)、half_true(部分真实)、mostly_true(基本属实)、pants_on_fire(彻头彻尾的谎言)、context(语境)、justification(依据)。
数据格式:CSV格式,文件名为LIAR.csv,便于数据分析和处理。数据已进行标注,便于进行模型训练。
该数据集适合用于政治言论的事实核查、真实性评估、以及相关领域的文本分析和自然语言处理。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于政治学、传播学、社会学等领域的学术研究,如政治话语分析、虚假信息传播研究、舆情分析等。
行业应用:为新闻媒体、事实核查机构、社交媒体平台提供数据支持,特别是在自动事实核查、舆情监测、虚假信息检测等方面。
决策支持:支持政府机构、政策制定者进行舆情监测和风险评估,辅助决策。
教育和培训:作为政治学、新闻学、数据科学等课程的实训数据,帮助学生和研究人员理解政治言论的复杂性,训练模型。
此数据集特别适合用于探索政治言论的真实性判断规律,构建自动事实核查系统,提升公众对政治信息的辨别能力。