找到45,099个数据集

标签: 机器学习

过滤结果
  • Code_Smell_Detection_Based_开源项目代码异味检测方法综述数据集

    2026年1月18日   

    数据集概述 本数据集是开源项目代码异味检测方法相关研究论文的综述总结,涵盖发表年份、数据集规模、项目数量、代码表示方式、质量属性、重构级别、预测类型、机器学习方法及评估指标等信息,为代码质量分析领域提供结构化参考。 文件详解 文件名称:Survey dataset.xlsx 文件格式:XLSX...
    packageimg
  • yaleemmlc_admissionprediction_急诊入院预测机器学习数据与脚本

    2026年1月17日   

    数据集概述 本数据集为PLOS One论文配套的首次发布数据,包含用于通过机器学习在急诊分诊阶段预测患者入院情况的数据与脚本。数据集以压缩包形式提供,未划分训练/测试集、数据/标签集或原始/处理数据集,支持相关医疗预测研究。 文件详解 文件名称:yaleemmlc/admissionprediction-v1.0.zip 文件格式:ZIP...
    packageimg
  • S2NANO_Based_金属纳米颗粒理化与细胞毒性数据集_for_nanoSAR模型开发

    2026年1月17日   

    数据集概述 本数据集是为nanoSAR模型开发整理的金属纳米颗粒纳米安全数据,源自S2NANO门户,通过挖掘六十三篇文献、补充制造商规格及参考文献得到。包含两千零五条记录、十四个变量,涵盖核心尺寸、表面电荷等理化特性,以及细胞系、暴露剂量等细胞毒性实验条件,用于支持纳米材料毒性预测模型构建。 文件详解 文件名称:2017_Metal_HYU.xlsx...
    packageimg
  • Santos_Basin_Based_Santos盆地沉积有机质多指标分析数据集_2023

    2026年1月17日   

    数据集概述 本数据集为Santos盆地(西南大西洋)沉积有机质积累省份研究的补充材料,包含表层沉积物中有机质的 bulk 成分、同位素组成、色素、生物聚合物及相关指数的完整数据,用于支撑多指标分析和机器学习研究,共包含1个文件。 文件详解 文件名称:Table S1_supplementary material_Carreira et al OCR...
    packageimg
  • CEST_GROUP_Based_CsSn_Cl_Br_I_3钙钛矿合金DFT机器学习数据集

    2026年1月17日   

    数据集概述 本数据集包含CsSn(Cl/Br/I)3钙钛矿合金的密度泛函理论(DFT)计算数据,用于训练能量预测机器学习模型。数据分为四个子集:sp_train_set、sp_test_set、al_data和relax_test_set,涵盖单点计算、主动学习和弛豫测试等场景,支持机器学习模型的训练与验证。 文件详解 sp_train_set...
    packageimg
  • American_Geologist_Submitted_蛇纹石矿物化学成分机器学习识别数据集

    2026年1月12日   

    数据集概述 本数据集包含用于通过化学成分识别蛇纹石矿物的机器学习研究所需的数据集和Python代码,支持论文研究工作。数据集含6个文件,包括4个代码文件和2个数据文件,可用于蛇纹石矿物的成分分析与机器学习模型构建。 文件详解 代码文件(.ipynb格式,共4个)...
    packageimg
  • C_elegans_Based_秀丽隐杆线虫snf_2_ok147_I基因突变体行为实验数据2009

    2026年1月4日   

    数据集概述 本数据集为秀丽隐杆线虫(C.elegans)RB641菌株(snf-2(ok147)I基因突变体)的行为实验数据,包含成年雌雄同体线虫在特定培养条件下的行为记录及分析结果,属于线虫行为数据库的一部分,支持线虫基因功能与行为关联的研究。 文件详解 核心数据文件 文件名称:snf-2 (ok147)I on food...
    packageimg
  • CO2_IL_Mixtures_Based_人工神经网络物性预测数据集_v1_0

    2026年1月15日   

    数据集概述 本数据集对应JPCB论文的研究内容,包含CO₂-离子液体混合物物性预测的数据库、结果数据,以及可复现研究结果的样本代码(需参考v1.0版本)。数据支持分析三种人工神经网络模型(CRT、STR、COMB)的性能差异,用于CO₂-离子液体混合物的物性预测研究。 文件详解 文件名称:SI_Final_Version.xlsx 文件格式:XLSX...
    packageimg
  • Zenodo_Supplementary_敏捷管理与机器学习系统映射研究补充材料

    2026年1月15日   

    数据集概述 本数据集是论文《Agile Management for Machine Learning: A Systematic Mapping Study》的补充材料,包含系统映射协议、搜索策略、纳入与排除研究列表、数据提取表及原始数据,旨在确保敏捷管理与机器学习项目交叉研究的透明度和可重复性。 文件详解 文件名称:Agile4ML-SMS-...
    packageimg
  • LinkedIn_Indonesia_职位帖热度预测机器学习分类数据集_2025

    2026年1月15日   

    数据集概述 本数据集包含从LinkedIn印尼平台收集的职位发布数据,用于支持机器学习分类模型预测职位帖热度的研究。数据为结构化格式,每条记录对应一个职位帖,涵盖职位标题、公司名称、行业等特征及公司粉丝数、发布日期等元数据,共包含一个文件。 文件详解 文件名称:20250301 - CLEAN.xlsx 文件格式:XLSX...
    packageimg
  • C_elegans_Based_秀丽隐杆线虫acr_21基因行为实验数据2010

    2026年1月15日   

    数据集概述 本数据集是秀丽隐杆线虫行为数据库的一部分,记录了RB1250品系(携带acr-21(ok1314)III基因突变)成年雌雄同体线虫的行为实验数据。实验在特定培养条件下进行,包含视频记录及处理后的行为特征数据,可用于研究该基因突变对线虫行为的影响。 文件详解 行为特征文件 文件名称:acr-21 (ok1314)III on food...
    packageimg
  • Machine_Learning_Aided_嵌段共聚物加工条件高通量检测数据集

    2026年1月15日   

    数据集概述 本数据集为"Machine Learning-Aided High Throughput Examination of Block Copolymer Processing Conditions"相关研究的配套数据,包含两个文件,分别为Python代码压缩包及Excel格式的数据文件,用于支持嵌段共聚物加工条件的机器学习辅助高通量检测研究。...
    packageimg
  • JT603_gpb_2_sa603_I_秀丽隐杆线虫基因功能行为实验数据2010

    2026年1月15日   

    数据集概述 本数据集为秀丽隐杆线虫行为数据库的组成部分,记录了JT603品系(gpb-2(sa603)I基因突变)成年雌雄同体线虫的行为实验数据,包含实验条件、视频采集参数及处理后的行为特征文件,用于研究该基因突变对秀丽隐杆线虫行为的影响。 文件详解 行为特征文件: 文件名称:gpb-2 (sa603)I on food...
    packageimg
  • LeNoM_Machine_learning_NISQ设备量子信道学习数据_v1

    2026年1月15日   

    数据集概述 本数据集包含论文《Machine learning of reduced quantum channels on NISQ devices》的相关数据、图表和代码,核心实现为LeNoM(Learning Noise Models)方法,用于在NISQ设备上学习简化量子信道,支持量子计算中噪声模型的研究与应用。 文件详解...
    packageimg
  • Slope_Stability_Based边坡稳定性预测特征驱动机器学习研究数据

    2026年1月15日   

    数据集概述 本数据集为基于特征驱动机器学习方法的边坡稳定性预测研究相关数据,包含1个Excel文件,未区分训练/测试集、数据/标签集或原始/处理数据,用于支持边坡稳定性预测模型的构建与验证。 文件详解 文件名称:Slope Stability.xlsx 文件格式:XLSX...
    packageimg
  • Deposition_maps_东亚及东南亚2000_2020活性氮沉降分布数据

    2026年1月15日   

    数据集概述 本数据集提供2000-2020年东亚及东南亚地区活性氮沉降分布数据,空间分辨率为0.25°×0.25°。通过集成机器学习方法建立站点实测数据与排放、气象及地理信息的关系,经交叉验证和独立测试验证精度(平均相关系数0.77),包含沉降分布地图及说明文件,共2个文件。 文件详解 数据文件 文件名称:Datafile.xlsx 文件格式:XLSX...
    packageimg
  • AI_ML_Based_精准农业AI与机器学习应用系统综述数据2013_2023

    2026年1月15日   

    数据集概述 本数据集为2013-2023年人工智能(AI)与机器学习(ML)在精准农业应用的系统综述补充材料,涵盖算法性能、资源效率、可持续性影响及 adoption 障碍等核心内容,包含95项纳入研究的提取数据、偏倚评估、分析脚本及可视化材料,支撑农业可持续发展相关研究。 文件详解 文件名称:PRISMA_2020_checklist.docx...
    packageimg
  • SAM_Sentiment_Analysis_印尼语情感词与文本细粒度标注数据集

    2026年1月15日   

    数据集概述 本数据集为基于Self-Assessment Manikin(SAM)效价量表的印尼语细粒度情感分析数据集,包含两类核心内容:经至少45人标注并取平均的印尼语情感词SAM效价得分(1-9分),以及含情感词的印尼语推文文本(至少3名语言专家标注并取平均的1-9分情感强度),用于支持细粒度情感分析模型开发。 文件详解 文件名称:labeled...
    packageimg
  • Dryad_Image_based_基于图像的自动物种识别虚拟数据增强研究数据集

    2026年1月15日   

    数据集概述 本数据集围绕基于图像的自动物种识别研究,聚焦虚拟数据增强方法能否解决样本不足问题。包含四类图像数据集(金龟子生殖器、蜜蜂翅纹、牛心凤蝶翅纹),通过图像旋转、GAN生成、特征空间过采样等增强手段,结合VGG-16特征提取与降维处理,验证增强方法对识别准确率的提升效果。 文件详解...
    packageimg
  • Pulp_Paper_Colombia_Based制浆造纸业风险事故分类评估数据

    2026年1月15日   

    数据集概述 本数据集为哥伦比亚某城市制浆造纸业的风险事故评估数据,包含原始评估矩阵及适用于数据挖掘分析的ARFF格式文件,共2个文件,可用于该行业风险事故的分类研究与安全管理分析。 文件详解 原始评估矩阵文件 文件名称:Pulp and paper risk accident classification matrix.xlsx 文件格式:XLSX...
    packageimg