-
Janssen_Based_2629种化合物抗SARS_CoV_2_RdRP虚拟筛选及细胞实验验证数据
2026年1月2日 30 168 66
数据集概述 本数据集记录了Janssen Pharmaceutica化合物库中2629种化合物针对SARS-CoV-2 RdRP靶点的虚拟筛选结果,以及潜在活性化合物在VeroE6细胞抗SARS-CoV-2实验中的验证数据,核心呈现药物筛选的关键结果。 文件详解 文件名称:Virtual screening of 2629 Janssen...
-
泰米尔语表情包恶意内容分类数据集
2025年12月20日 30 194 37
数据集概述 本数据集是针对泰米尔语表情包的恶意内容分类资源,包含标注为“恶意”和“非恶意”的表情包图像,以及对应的拉丁转写文本,旨在支持印度语言表情包恶意内容的计算建模研究。 文件详解 文件名称: Tamil_troll_memes-dataset.zip 文件格式: ZIP压缩包 内容说明:...
-
数据2020年灾难推文语料库
2025年12月7日 30 196 10
数据集概述 该数据集包含2020年收集的、覆盖10类灾难共48起事件的推文数据,每条推文标注了是否与对应灾难相关。数据以平衡正负样本的文件形式组织,旨在为灾难相关推文过滤算法提供基准测试支持。 文件详解 文件名称:disaster-tweet-filtering-tranquil-tweets.zip 文件格式:ZIP压缩包...
-
RECOD_ai重大事件社交媒体链接数据集
2025年12月13日 30 121 9
数据集概述 本数据集包含2018年8月14日至2021年1月6日期间发生的34起法医相关事件的社交媒体内容链接,涵盖火灾、坍塌、枪击等六类事件,提供各事件的社交帖子、图片、视频链接及配套说明文件,支持法医分析研究。 文件详解 核心压缩文件: recod-ai-events-dataset-...
-
米兰奥古斯特模型数据集
2025年12月11日 30 162 60
数据集概述 本数据集包含与“米兰奥古斯特模型”相关的文件,主要由图片文件和三维模型文件构成,为模型的视觉呈现与三维结构展示提供数据支持。 文件详解 文件名称: thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg:文件格式为JPEG,共4个,占文件总数的百分之八十,推测为模型的缩略图或预览图片。 文件名称:...
-
Webis网页错误标注数据集2019
2025年12月8日 30 30 7
数据集概述 本数据集包含对Webis-Web-Archive-17中一万个网页存档的多种标注,涵盖广告占比、页面完整性、加载状态、色情内容等类别,以及弹窗、验证码、错误信息的显示程度,为网页内容质量分析提供标注数据支持。 文件详解 该数据集包含四个文件,具体说明如下: - 数据文件: - webis-web-archive-17-content-...
-
多语言错误信息推文数据集
2025年12月7日 30 72 55
数据集概述 该数据集包含多语言错误信息推文(MMTweet)相关的标注指南、结构化数据文件、代码脚本等资源,覆盖推文分类、声明匹配等任务,支持多语言错误信息检测与分析研究。 文件详解 标注指南文件: Data Annotation – Tweet Classification.pdf:PDF格式,推文分类任务的标注规范文档 Data...
-
CMU_MisCov19新冠疫情Twitter错误信息特征数据集
2025年12月6日 30 88 87
数据集概述 该数据集为针对新冠疫情相关Twitter错误信息的标注数据集,包含四千五百七十三条标注推文,覆盖十七个主题,同时提供标注编码手册,用于错误信息检测与特征分析研究。 文件详解 文件名称:COVID_19_Twitter_Misinformation_Codebook.pdf 文件格式:PDF...
-
HUMANE项目REVEAL子项目人机网络调查协议
2025年12月5日 30 7 2
数据集概述 本数据集是HUMANE项目框架下,针对REVEAL子项目设计的调查协议文档。REVEAL项目是人机网络(HMN)的典型案例,提供社交媒体内容聚合、过滤、推荐工具,助力用户分析信息可信度等隐藏维度。该调查聚焦REVEAL项目中人机交互场景,收集相关影响及设计建议反馈。 文件详解 文件名称:REVEAL Survey1.pdf...
-
CT_FAN多语言假新闻检测数据集2022
2025年12月5日 30 26 5
数据集概述 该数据集为多语言假新闻检测任务设计,包含2010-2022年英文和德文新闻文章,标注其真实性评级(假、部分假、真、其他)及主题领域,支持跨语言迁移学习研究,适用于构建多语言假新闻分类模型。 文件详解 文件名称:FakeNews_Task3_2022.zip 文件格式:ZIP压缩包 内部数据字段: ID:新闻文章唯一标识符...
-
虚假新闻检测数据集GottobeFakeData-nikhilkottoli
2025年5月28日 30 186 126
虚假新闻检测数据集GottobeFakeData-nikhilkottoli 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,新闻媒体,谣言识别 数据概述: 该数据集包含用于虚假新闻检测的数据,记录了新闻文章的真实性标签和相关文本内容。主要特征如下:...
-
电子邮件检测数据集EmailsDetectionDataset-gungunshukla15
2025年4月25日 30 166 92
电子邮件检测数据集EmailsDetectionDataset-gungunshukla15 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件检测,数据集,机器学习,文本分析,网络安全,文本挖掘,信息过滤 数据概述:...
-
垃圾邮件检测数据集SpamEmailDetectionDataset-studymart
2025年4月25日 30 197 55
垃圾邮件检测数据集SpamEmailDetectionDataset-studymart 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,数据集,机器学习,分类算法,网络安全,数据处理,信息过滤 数据概述:该数据集包含来自多个来源的电子邮件记录,主要用于垃圾邮件检测和分类。主要特征如下: 时间跨度:数据记录的时间范围从2002年到2015年。...
-
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara
2025年4月24日 30 143 96
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara 数据来源:互联网公开数据 标签:垃圾邮件,短信,数据集,文本分析,机器学习,自然语言处理,信息过滤,网络安全 数据概述:该数据集包含来自多个来源的垃圾邮件和短信数据,记录了不同类型的垃圾信息。主要特征如下:...
-
垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad
2025年4月24日 30 66 47
垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad 数据来源:互联网公开数据 标签:垃圾邮件检测,数据集,电子邮件分析,机器学习,信息过滤,网络安全,数据科学,文本分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,用于垃圾邮件检测任务。主要特征如下:...
-
垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven
2025年4月24日 30 147 146
垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,信息过滤,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和分类标签(垃圾邮件或正常邮件)。主要特征如下:...
-
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr
2025年4月23日 30 123 78
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,网络安全,信息过滤 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了大量标记为垃圾邮件和非垃圾邮件的电子邮件内容。主要特征如下:...
-
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746
2025年4月23日 30 15 2
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746 数据来源:互联网公开数据 标签:短信分类,垃圾信息,数据集,文本分析,机器学习,自然语言处理,信息过滤,通信安全 数据概述: 该数据集包含来自公开短信数据源的短信信息,记录了用户接收的短信内容及其分类标签(垃圾短信或正常短信)。主要特征如下:...
-
YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee
2025年4月22日 30 179 37
YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,垃圾评论,机器学习,自然语言处理,文本分类,信息过滤 数据概述:...
-
印度短信垃圾信息与正常信息分类数据集
2025年4月14日 30 182 166
印度短信垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,文本分类,自然语言处理,数据分析,机器学习,信息过滤 数据概述:...



