政治新闻事实性评估数据集_Political_News_Factuality_Assessment_Dataset

政治新闻事实性评估数据集_Political_News_Factuality_Assessment_Dataset

数据来源:互联网公开数据

标签:事实核查, 政治新闻, 文本分类, 自然语言处理, 机器学习, 谣言检测, 舆情分析, 数据标注

数据概述: 该数据集包含来自新闻报道的事实性评估数据,记录了政治新闻声明的真实性标签及相关信息。主要特征如下: 时间跨度:数据未标明具体时间,通常被视为静态数据集,反映特定时期内的政治言论和事实核查结果。 地理范围:数据覆盖范围广泛,涉及美国政治新闻及相关陈述。 数据维度:数据集包括声明文本、真实性标签(如“真”、“假”、“部分属实”等)、主题关键词、发言人、发言人职位、发言人所属机构、政治立场、以及相关支持信息(如引用来源、评估依据等)。 数据格式:主要提供CSV格式数据,例如train.csv, valid.csv, test.csv,便于数据分析与模型训练。此外,还包括JSON格式的配置文件,用于存储模型配置和词汇表信息。 来源信息:数据来源于公开的事实核查项目,已进行结构化处理,便于分析和应用。 该数据集适合用于事实核查、谣言检测、政治新闻分析、以及相关自然语言处理任务的学术研究和技术开发。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于自然语言处理、机器学习、社会科学等领域的研究,如事实核查模型的构建、政治言论分析、舆情分析等。 行业应用:为新闻媒体、社交平台、内容审核机构等提供数据支持,用于自动化事实核查、虚假信息检测、内容推荐优化等。 决策支持:支持政府部门、研究机构等进行政治风险评估、政策影响分析、公众舆论监测等。 教育和培训:作为自然语言处理、机器学习相关课程的实训材料,帮助学生和研究人员理解事实核查的流程和方法,提升相关技能。 此数据集特别适合用于探索新闻声明的真实性判断、评估政治言论的可信度,并为构建可靠的虚假信息检测系统提供数据基础。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 392.2 MiB
最后更新 2025年6月28日
创建于 2025年6月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。