-
LeetSpeak_Based_垃圾邮件混淆数据集
2026年1月31日 30 4 0
数据集概述 本数据集通过LeetSpeak转换对公开垃圾邮件数据集进行部分混淆处理,用于评估反混淆技术及其对垃圾邮件分类的影响。包含YouTube垃圾邮件集合、YouTube评论子集、CSDMC2010、TREC2007四个来源的混淆文本数据,以压缩包形式提供。 文件详解 文件名称:corpora.zip 文件格式:ZIP(压缩包)...
-
机器黑客假新闻内容检测数据集MachineHackFakeNewsContentDetectionDataset-ssismasterchief
2025年4月26日 30 116 25
机器黑客假新闻内容检测数据集MachineHackFakeNewsContentDetectionDataset-ssismasterchief 数据来源:互联网公开数据 标签:假新闻,内容检测,数据集,自然语言处理,机器学习,文本分析,信息安全,数据挖掘 数据概述: 该数据集来源于机器黑客(Machine...
-
推特内容检测数据集TwitterContentDetectionDataset-dattamuthevi
2025年4月25日 30 129 128
推特内容检测数据集TwitterContentDetectionDataset-dattamuthevi 数据来源:互联网公开数据 标签:社交媒体,内容检测,数据集,机器学习,自然语言处理,情感分析,网络信息,数据挖掘 数据概述: 该数据集包含来自推特平台的公开内容数据,记录了用户发布的信息及其相关属性。主要特征如下:...
-
虚假新闻内容检测数据集
2025年4月15日 30 110 50
虚假新闻内容检测数据集 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,NLP,内容检测,文本分类,社交媒体,新闻平台,机器学习 数据概述...
-
在线赌博检测数据集
2025年4月14日 30 59 5
在线赌博检测数据集 数据来源:互联网公开数据 标签:在线赌博,社交媒体,内容检测,自然语言处理,公共事件,实时分析 数据概述: 本数据集包含来自“Yogyakarta夜 carnival 9”实时直播的评论数据,该活动是为了庆祝Yogyakarta市成立268周年。数据集收集了直播期间的用户评论,用于分析和检测在线赌博的推广行为。数据集包含以下字段:...



