-
有丝分裂亚型分类数据集
2025年12月12日 30 23 14
数据集概述 该数据集是用于组织病理学全切片图像中异常有丝分裂检测的精选子集,包含八千二百三十六个六十四像素×六十四像素的图像块,分为伪影、模拟物、有丝分裂、异常有丝分裂四类,采用三折交叉验证划分,支持算法标准化评估。 文件详解 文件名称: TCGA_Mitosis_Subtyping.zip 文件格式: ZIP压缩包 内容说明:...
-
RNA设计与机器学习综合数据集
2025年12月11日 30 189 73
数据集概述 本数据集汇集了从主要RNA数据库提取的RNA多环结构综合数据,以及多种RNA设计算法的基准测试结果,旨在为RNA设计(尤其是多环结构领域)的研究与开发提供支持。 文件详解 文件名称:comprehensive-datasets-for-rna-design-machine-learning-and-beyond.zip...
-
S390_Microclean高速钢纳米压痕数据集
2025年12月11日 30 136 115
数据集概述 该数据集包含S390 Microclean™高速钢经不同热处理后的纳米压痕实验数据,支持机器学习模型训练与验证。数据通过TS77 Select Bruker-Hysitron纳米压痕仪采集,对应《Explainable machine learning and feature engineering applied to...
-
代码异味数据集_DACOS
2025年12月10日 30 101 21
数据集概述 该数据集提供三类代码异味(多面抽象、复杂方法、长参数列表)的标注代码片段,包含人工标注的主观片段数据集及更大规模的明确良性或异味的代码片段集,通过SQL文件和源码压缩包形式存储。 文件详解...
-
SW480与SW620结直肠癌细胞分类训练数据集
2025年12月9日 30 118 57
数据集概述 本数据集包含了用于分类SW480和SW620两种结直肠癌细胞的训练数据。数据根据细胞系(SW480, SW620)分别存放,每种细胞系均包含四种类型的图像数据:光程差(OPD)图、振幅图、全息图以及基于事件的图像。该数据集为开发和训练机器学习模型以自动区分这两种细胞系提供了基础。请注意,这只是一个部分数据集,完整版本将在相关手稿发表后公开。...
-
图像隐私预测数据集PrivacyAlert
2025年12月9日 30 117 83
数据集概述 该数据集为图像隐私预测任务构建,包含来自Flickr的图像,通过众包平台标注为私密/公开类型。私密图像含敏感信息,不适用于社交媒体公开分享;公开图像则可安全共享,可用于训练二分类机器学习或深度学习模型预测图像敏感信息。 文件详解 文件名称:privacy_detection_dataset_v2.zip 文件格式:ZIP压缩包...
-
太阳耀斑预测数据集_SHARP磁场参数机器学习
2025年12月9日 30 93 85
数据集概述 该数据集包含2023年1月1日至2025年5月31日期间处理后的SHARP(太阳动力学天文台/日震和磁像仪)磁场参数,用于太阳耀斑预测任务。遵循Abduallah等人2023年《科学报告》中的数据组装协议,支持C耀斑、M耀斑、M5耀斑三种预测任务及24小时、48小时、72小时三种时间窗口的训练与测试。 文件详解 文件名称:...
-
DiffPharma数据集_生成分子与预训练模型
2025年12月8日 30 137 77
数据集概述 本数据集包含DiffPharma项目相关的训练测试数据、模型生成分子结构及预训练模型 checkpoint 文件,为药物研发领域的分子生成研究提供基础数据与模型支持。 文件详解 dataset.zip:ZIP压缩文件,包含模型开发过程中使用的训练和测试数据集。...
-
生物医学机器学习本体匹配数据集2024
2025年12月8日 30 200 111
数据集概述 本数据集用于支持生物医学领域的等价和包含关系本体匹配任务,包含从MONDO和UMLS提取的五组本体对,覆盖疾病、人体、药学、肿瘤等类别,提供源本体、目标本体及参考映射数据,适用于机器学习模型训练与评估。 文件详解 该数据集包含5个ZIP格式的文件,每个文件对应一个任务文件夹,具体说明如下: - 文件名称示例: snomed-...
-
奶牛亚临床乳腺炎热成像数据集TIDS
2025年12月8日 0 52 6
数据集概述 该数据集包含希腊中部16个农场收集的418张带注释的奶牛热成像图像,其中207张标注为亚临床乳腺炎(SCM)病例,211张为健康样本。图像由FLIR E96热像仪在标准化条件下拍摄,包含乳房区域的完整和手动裁剪图像,健康状态基于体细胞计数(SCC)测量确定。 文件详解 文件名称: TIDS Dataset.zip 文件格式:...
-
CardioPRINT生物特征识别数据集
2025年12月6日 30 72 68
数据集概述 本数据集包含用于CardioPRINT生物特征识别研究的心电图(ECG)和心阻抗图(ICG)信号,以及标记不同情绪状态起止时间的时间戳表。数据经选择性编辑,保留与情绪变化相关的有效信号段并拼接,形成含情绪转换时间点间断的非连续信号,为基于心脏特征的生物识别研究提供支持。 文件详解 时间戳文件(CSV格式):...
-
HTTPS暴力破解扩展网络流数据集
2025年12月5日 30 130 67
数据集概述 该数据集旨在支持HTTPS暴力破解攻击检测器的设计,包含通过Ipifixprobe流量导出器捕获的扩展网络流数据。除传统网络流字段外,每条流还记录前一百个数据包的传输层大小、方向、包间时间、TCP标志等信息,零负载数据包已被过滤。数据包含原始流、聚合流及特征提取样本三类文件,适用于机器学习模型训练。 文件详解 文件名称:...
-
火星新奇性检测Mastcam标记数据集
2025年12月5日 30 93 76
数据集概述 该数据集为火星新奇性检测实验所用,基于Mastcam图像构建,包含训练、测试及验证相关的压缩文件,用于行星探测任务中多光谱图像新奇性检测方法的对比研究。 文件详解 该数据集包含4个压缩文件,具体说明如下: - 文件名称:test_novel.zip - 文件格式:ZIP - 内容:用于新奇性检测测试的相关数据 -...
-
ITU_T_AI_Challenge_改进IEEE_802_11_WLAN容量机器学习项目输入输出数据集
2025年12月4日 30 203 92
数据集概述 本数据集为ITU-T AI挑战赛参与者提供,包含通过机器学习改进IEEE 802.11 WLAN容量项目的输入输出数据,涵盖节点标签、位置等输入信息及吞吐量、RSSI、干扰图、SINR等模拟输出结果。 文件详解 文件名称及格式: input_node_files.zip:压缩文件,包含训练用节点标签、位置、信道等输入信息...
-
基因组基准数据集版本1
2025年12月4日 30 186 152
数据集概述 该数据集为《Genomic benchmarks: a collection of datasets for genomic sequence classification》手稿中发表的数据集集合,包含27个文件,涉及人类、果蝇等物种的基因组序列分类相关数据,支持基因组序列分类研究。 文件详解 该数据集包含两种格式的文件,具体说明如下: -...
-
互联网公开数据集大规模URL与分类标注数据
2025年4月8日 31 111 57
标题:互联网公开数据集大规模URL与分类标注数据 数据内容: 该数据集包含从互联网公开数据中收集的URL(统一资源定位符)以及对应的分类标注信息。数据集的主要数据元素包括: 1. URL:表示具体的网页或资源地址,共有507,195个不同的值,覆盖了广泛的互联网资源。 2....



