新冠疫情虚假信息识别数据集COVID-19FakeInformationDetectionDataset-drthabitfursan

新冠疫情虚假信息识别数据集COVID-19FakeInformationDetectionDataset-drthabitfursan

数据来源:互联网公开数据

标签:新冠疫情, 虚假信息, 事实核查, 社交媒体, 文本分析, 谣言检测, 舆情分析, 数据挖掘

数据概述: 该数据集包含来自社交媒体平台及新闻网站的数据,记录了关于新冠疫情的真实信息与虚假信息。主要特征如下: 时间跨度:数据未明确标明时间范围,但包含了多个不同版本的文件,可能覆盖了疫情爆发初期至后期的时间段,具体时间待考证。 地理范围:数据可能来源于全球范围,但未明确标注具体国家或地区。 数据维度:数据集包含多种类型的数据,主要包括: 新闻文章:包含标题、内容、摘要、发布日期、关键词等信息,用于识别新闻真实性。 社交媒体推文:包含推文ID、回复ID等,用于分析社交媒体上的信息传播。 事实核查链接:提供事实核查网站的链接,用于判断信息的真实性。 数据格式:数据集以CSV格式提供,包含多个不同的CSV文件,每个文件对应不同的数据类型和来源。 来源信息:数据来源包括社交媒体平台和新闻网站,其中部分数据可能经过整理和标注,用于识别虚假信息。 该数据集适合用于新冠疫情相关虚假信息的检测、分析,以及社交媒体舆情分析。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于信息科学、传播学、社会学等领域的研究,如虚假信息传播机制、谣言分析、舆情监测等。 行业应用:为媒体、社交平台、政府机构等提供数据支持,特别是在内容审核、风险预警、公共卫生信息管理等方面。 决策支持:支持政府和相关机构制定应对疫情的策略,提高信息传播的准确性和及时性。 教育和培训:作为信息真伪辨别、媒体素养、数据分析等课程的辅助材料,帮助学生和研究人员深入理解虚假信息的传播与影响。 此数据集特别适合用于探索新冠疫情期间虚假信息的传播规律,帮助用户构建识别虚假信息的模型,提升信息甄别能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 16, 2025, 06:46 (UTC)
创建于 五月 16, 2025, 06:46 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。