-
NNSeval_Based_非母语者词汇简化评估数据集
2026年2月9日 30 44 14
数据集概述 本数据集基于针对非母语者的词汇复杂度用户研究构建,包含400名非母语者对维基百科、LSeval和LexMTurk来源句子中内容词的理解度标注结果,经筛选优化后形成NNSeval数据集,可用于评估词汇简化系统对非母语者的适用性。 文件详解 文件名称:NNSeval.zip 文件格式:ZIP...
-
RDiverseVul_Refined_DiverseVul数据集
2026年1月27日 30 80 4
数据集概述 本数据集是原始DiverseVul数据集的优化版本,通过移除重复条目及错误数据生成。原始数据中存在七千九百零一条重复记录,包括完全由注释组成的条目、代码相同但函数名不同且标签相反的条目等问题数据。优化后数据集仅包含一个文件。 文件详解 文件名称:RDiverseVul.json 文件格式:JSON...
-
DDoS_Attacks_Based_CICDDOS2019与CICIDS2017合并标准化数据集
2026年1月6日 30 205 65
数据集概述 本数据集是对Iman Sharafaldin等人2019年的CICDDOS2019数据集的转换,合并了两个数据集并标准化标签,移除无穷值,同时补充CICIDS2017的良性元组以提升良性数据比例,用于网络安全领域DDoS攻击相关分析。 文件详解 文件名称:ready_dataset.zip 文件格式:ZIP...
-
时尚产品图片与文本数据集
2025年5月31日 30 196 139
时尚产品图片与文本数据集 数据来源:互联网公开数据 标签:时尚产品,图片数据,产品描述,多模态AI,数据集优化,图像处理,产品推荐 数据概述: 本数据集是一个经过优化的时尚产品图片与文本配对集合,设计用于训练和微调多模态AI模型。数据集基于Param...
-
手写数字识别MNIST数据集优化版1998-2017
2025年4月17日 30 1 0
手写数字识别MNIST数据集优化版1998-2017 数据来源:互联网公开数据 标签:手写数字识别,MNIST,图像分类,机器学习,深度学习,数据集优化,预处理 数据概述: 本数据集是著名的手写数字识别数据集MNIST的定制和重组版本,由Yann LeCun、Corinna Cortes和Christopher J.C....
-
城市声音MFCC特征数据集
2025年4月14日 30 210 110
城市声音MFCC特征数据集 数据来源:互联网公开数据 标签:城市声音,音频特征,机器学习,声音分类,MFCC,数据集优化,环境音 数据概述: 本数据集是Urban Sound...



