伊斯兰议题事实核查与虚假信息识别数据集-suhaibkhalil
数据来源:互联网公开数据
标签:伊斯兰,虚假信息,事实核查,文本分类,社交媒体,深度学习,宗教,新闻,舆情分析
数据概述:
本数据集是一个二元分类数据集,主要用于识别与伊斯兰议题相关的正确信息和虚假信息。数据集来源于一项研究(DISINFORMATION DETECTION ABOUT ISLAMIC ISSUES ON SOCIAL MEDIA USING DEEP LEARNING TECHNIQUES),该研究成果已发表在MJCS期刊上,链接为:https://ejournal.um.edu.my/index.php/MJCS/article/view/41935。
数据集包含以下五个字段:
- ID:每篇文章的唯一标识符。
- Article:文章内容,包含与伊斯兰议题相关的文本。如果信息正确,则为事实描述;如果信息错误,则为针对伊斯兰教的虚假信息。大多数文章仅包含正文,没有标题。
- Propagation Source:信息来源。如果文章为虚假信息,则包含Facebook链接;如果文章内容正确,则包含伊斯兰网站链接,例如对经文的解释、圣训或与伊斯兰教相关的文章。
- Article Type:文章类型。如果文章为虚假信息,则为帖子(post);如果信息正确,则为伊斯兰文章、古兰经解释或圣训。
- Class Type:文章所属类别,分为正确信息和虚假信息两类。
数据用途概述:
该数据集适用于虚假信息检测、文本分类、自然语言处理、舆情分析等多种研究和应用场景。研究人员可以使用此数据训练和评估深度学习模型,以识别社交媒体上关于伊斯兰议题的虚假信息。此外,该数据集也可用于研究虚假信息的传播模式、分析特定主题的舆论,以及开发用于事实核查的工具。