数据集

社交媒体虚假信息检测数据集SocialMediaFakeInformationDetectionDataset-karthikeyanmsk

数据来源：互联网公开数据

标签：虚假信息检测, 社交媒体, 文本分析, 图像分析, 新闻真伪, 机器学习, 情感分析, 自然语言处理

数据概述：该数据集包含来自社交媒体平台的数据，记录了新闻文章的文本内容、相关图像、来源网站、所属类别、发布日期以及人工标注的真伪标签。主要特征如下：时间跨度：数据未明确标明具体时间范围，但包含了文章的发布日期信息。地理范围：数据来源于多个国家或地区的社交媒体平台，内容涵盖全球范围内的事件。数据维度：包括“text”（文章文本）、“image”（相关图片链接）、“web”（来源网站）、“category”（文章类别）、“date”（发布日期）和“label”（真伪标签，如“Fake”或“TRUE”）等多个字段。数据格式：CSV格式，文件名为IFNDcsv，方便进行文本、图像和结构化数据的综合处理。来源信息：数据来源于社交媒体平台抓取，并经过人工标注真伪标签。该数据集适合用于虚假信息检测、新闻真伪辨别、以及跨模态信息融合等研究和应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于社交媒体信息分析、虚假信息传播机制研究等学术研究，如基于文本和图像内容的虚假信息检测模型构建。行业应用：为新闻媒体、社交平台、内容审核机构提供数据支持，用于提升内容审核的效率和准确性，防止虚假信息传播。决策支持：支持政府部门、监管机构对社交媒体信息的监控与管理，辅助制定相关政策和策略。教育和培训：作为信息科学、传播学等专业课程的辅助材料，帮助学生和研究人员深入理解虚假信息传播的特点和应对策略。此数据集特别适合用于探索社交媒体上虚假信息的传播规律和特点，提升用户对信息的辨别能力，并构建更有效的虚假信息检测模型。

数据与资源

versions_20250318072111.zipZIP
3.27 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	3.27 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。