真相追寻者2023数据集

真相追寻者2023数据集 数据来源:互联网公开数据
标签:假新闻检测,社交媒体分析,BERT模型,机器学习,深度学习,推特数据,内容真实性

数据概述:
真相追寻者2023数据集是一个大规模的虚假新闻分析基准数据集,旨在为社交平台上的真实和虚假新闻内容提供地面实况分析。该数据集包含了超过180,000条标注的推特,通过三因素主动学习方法进行验证,涉及456名独特的高技能亚马逊 Mechanical Turkers 进行标注。此外,数据集引入了三个辅助社交媒体评分:Bot评分、可信度评分和影响力评分,用于分析推特用户的特征。数据集还包含推特文本和用户元数据,支持深度学习和经典机器学习技术的应用。

数据用途概述:
该数据集适用于多种应用场景,包括虚假新闻检测模型的训练与评估、社交媒体用户行为分析、虚假信息传播模式研究以及内容真实性的评估。研究人员可以利用数据集建立深度学习检测模型,或进行基于聚类的事件检测。数据集还支持对推特标签与在线内容创作者/传播者特征之间关系的探索。此外,该数据集为学术研究和工业应用提供了丰富的资源,有助于提升虚假新闻检测的准确性和效率,同时也为政策制定者提供了数据支持,以应对虚假信息的挑战。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 48.89 MiB
最后更新 2025年4月27日
创建于 2025年4月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。