-
水稻叶部病害数据集
2025年12月21日 30 138 135
数据集概述 该数据集是对Kaggle平台Rice_Data_3数据集的优化版本,通过数据增强解决了原始数据数量少、类别不平衡的问题,包含稻褐条病、稻瘟病、细菌性叶枯病三类病害图像,各分类均有446张训练图、128张验证图和64张测试图,适合机器学习模型训练。 文件详解 文件名称:Rice Leaf Disease Dataset.zip...
-
公平推荐系统数据集_Fair_RecSys
2025年12月20日 30 147 44
数据集概述 该数据集包含四个多媒体推荐系统数据集,用于研究推荐系统中的流行度偏差与公平性问题。每个数据集基于公开基准数据构建,包含用户交互记录及按主流偏好划分的用户分组数据,为公平推荐算法的开发与评估提供支持。 文件详解 该数据集包含四个压缩包文件,每个压缩包对应一个推荐系统场景,内部文件结构统一: - 压缩包文件(共4个): -...
-
数据操作数据集
2025年12月19日 30 174 126
数据集概述 本数据集来自Kaggle,是数据工程课程的一部分。包含一个HTML格式文件,未进行训练/测试、数据/标签或原始/处理数据的拆分,无自述文件或内容预览,文件类型单一。 文件详解 文件名称: Untitled29.html 文件格式: HTML (.html) 内容说明: 数据集唯一文件,具体字段及内容因无预览信息无法提供详细映射。 数据来源...
-
DeepGlobe七类地物分割Res_UNet模型数据集
2025年12月18日 30 132 129
数据集概述 该数据集包含基于DeepGlobe地物分类数据集训练的Res-UNet模型,用于512×512×3像素RGB高分辨率图像的七类地物分割(城市、农业、牧场、森林、水体、裸地、未知)。模型由Segmentation Gym生成,配套有配置文件、权重文件、模型卡片等多类型文件,支持遥感图像分割任务的模型复用与评估。 文件详解...
-
NBA球员数据集与预测模型
2025年12月16日 30 95 39
数据集概述 本数据集围绕NBA球员历史统计数据(2012-2024年)构建,包含基于随机森林模型的预测分析成果,涵盖模型训练文件、评估指标、可视化结果及FAIR4ML元数据,为NBA球员表现预测研究提供支持。 文件详解 文件名称:...
-
Kaggle维基百科每日网络流量数据集_含缺失值
2025年12月16日 30 176 139
数据集概述 本数据集是Kaggle维基百科网络流量预测竞赛所用数据,包含十四万五千零六十三条每日时间序列,记录2015年7月1日至2017年9月10日期间一组维基百科页面的点击量或网络流量数据,存在缺失值。 文件详解 文件名称: kaggle_web_traffic_dataset_with_missing_values.zip 文件格式:...
-
伦敦智能电表数据集_无缺失值
2025年12月15日 30 104 45
数据集概述 该数据集包含伦敦家庭2011年11月至2014年2月的智能电表数据,共5560条半小时级用电量时间序列(单位:千瓦时)。原始数据的缺失值已通过LOCF方法(前向填充最近观测值)处理,提供无缺失值的完整数据。 文件详解 文件名称:london_smart_meters_dataset_without_missing_values.zip...
-
黄瓜病害与新鲜度分类数据集
2025年12月15日 30 75 51
数据集概述 该数据集包含人工标注的黄瓜叶片、果实病害图像及新鲜样本图像,用于支持植物病害检测与分类研究。基于Kaggle平台的“Cucumber Disease Recognition Dataset”,通过Label Studio进行标准化标注,涵盖7个分类类别,适用于深度学习模型的训练与评估。 文件详解 压缩文件...
-
Reddit帖子情感与股价变动关联数据集
2025年12月13日 30 161 76
数据集概述 本数据集聚焦Reddit金融社区帖子情感与股价短期变动的关联分析,涵盖苹果、特斯拉、亚马逊、微软、谷歌五家科技公司的Reddit帖子数据及对应股票价格数据,通过情感标注与相关性计算探索社交媒体对股价的潜在影响。 文件详解 数据文件:...
-
Kaggle维基百科日度网络流量数据集_无缺失值
2025年12月12日 30 184 132
数据集概述 该数据集为Kaggle维基百科网络流量预测竞赛所用数据,包含十四万五千零六十三条日度时间序列,记录了2015年7月1日至2017年9月10日期间一组维基百科页面的访问量或网络流量数据,原始数据的缺失值已被替换为零。 文件详解 文件名称:...
-
Kaggle维基百科周度网络流量数据集
2025年12月11日 30 130 2
数据集概述 该数据集是Kaggle维基百科网络流量预测竞赛日度数据集的周度聚合版本,包含十四万五千零六十三条时间序列,记录了2015年7月1日至2017年9月5日期间一组维基百科页面的周度访问量,原始缺失值已被替换为零后聚合。 文件详解 文件名称: kaggle_web_traffic_weekly_dataset.zip 文件格式: ZIP压缩包...
-
伦敦智能电表数据集_含缺失值
2025年12月10日 30 97 88
数据集概述 该数据集包含伦敦家庭2011年11月至2014年2月的智能电表数据,以半小时为间隔记录家庭用电量(单位:千瓦时),共5560条时间序列数据,且包含缺失值。 文件详解 文件名称:london_smart_meters_dataset_with_missing_values.zip 文件格式:ZIP压缩文件...
-
猫狗样本数据集
2025年12月5日 30 149 1
数据集概述 该数据集是Kaggle猫狗数据集的小型样本,包含训练集和测试集的猫狗图像,为图像分类任务提供基础样本数据。 文件详解 文件名称: cats_dogs_light.zip 文件格式: ZIP(压缩文件) 文件内容: 压缩包内包含1000张训练集图像(500张猫、500张狗)和400张测试集图像(各200张) 数据来源 Kaggle 适用场景...
-
印尼政治谣言数据集
2025年11月29日 30 8 3
数据集概述 该数据集包含印尼政治新闻文章,分为谣言和非谣言两类,整合了Kaggle数据集与从可靠在线新闻平台收集的新数据,为相关研究提供支持。 文件详解 文件名称: combined_test.csv,文件格式: CSV 字段: cleaned(清洗后的文本内容)、label(标签,区分谣言与非谣言) 文件名称:...
-
多智能体系统现代趋势航空乘客满意度数据集2022
2025年11月29日 30 97 86
数据集概述 该数据集为2022年12月提交至MDPI《未来互联网》多智能体系统特刊的研究成果复现数据,基于航空乘客满意度原始数据处理而成,包含训练与测试两类CSV文件,支持相关实验验证。 文件详解 目录: MDPI Future Internet, Special Issue on Modern Trends in Multi-Agent...
-
橙子果实病害图像数据集
2025年11月28日 30 192 157
数据集概述 该数据集包含影响橙子的主要病害图像,涵盖黑斑病、溃疡病、黄龙病、疮痂病及健康果实五大类。图像来自不同来源,包含多种光照条件与质量,共七百零一张,为农业计算机视觉研究提供多样化数据支持。 文件详解 该数据集由压缩包和分类图像文件组成,具体说明如下: - 压缩包文件: - Orange Fruit Diseases Dataset.zip:...
-
-
个人防护装备数据集
2025年11月28日 30 83 41
数据集概述 该数据集专为工业安全应用设计,包含两千二百八十六张六百四十乘六百四十像素的高质量标注图像,聚焦安全帽、反光背心等个人防护装备(PPE)的检测,适用于计算机视觉模型训练与应用,为工业安全监测系统优化提供数据支持。 文件详解 文件名称: Dataset of Personal Protective Equipment...
-
糖尿病视网膜病变集成模型检测数据集
2025年11月28日 30 126 5
数据集概述 本数据集包含两个子数据集,用于糖尿病视网膜病变(DR)的集成模型检测研究。其中一个数据集来自Kaggle平台,另一个来自孟加拉国两家眼科医院,以压缩文件形式存储,未包含训练/测试、数据/标签或原始/处理的划分。 文件详解 该数据集包含两个压缩文件,具体说明如下: - 文件名称: DR Detection Using Ensemble...
-
糖尿病视网膜病变数据集
2025年11月27日 30 57 24
数据集概述 该数据集包含用于糖尿病视网膜病变(DR)分类的视网膜图像,总计两千八百三十八张。数据集按比例划分:百分之七十为训练集(含一千零五十张DR图像、一千零二十六张非DR图像),百分之三十为测试集和验证集(测试集二百三十一张、验证集五百三十一张),为DR分类研究提供基础数据支持。 文件详解 文件名称: Diabetic Retinopathy/DR...



