-
Random_Forest_Based_生态学与进化遗传关联研究实践指南数据
数据集概述 本数据集为随机森林算法在生态学与进化遗传关联研究中的实践指南配套资源,包含输入数据、R代码教程、模拟脚本及结果文件,支持离散与数量性状的基因位点关联分析,适用于野生或非模式生物基因组研究,共7个文件。 文件详解 压缩包文件 文件名称:Input data files and R code to examine overfitting by...
-
Chinook_salmon_Based_奇努克鲑鱼洄游时间基因组分析数据集
数据集概述 本数据集聚焦奇努克鲑鱼洄游时间的基因组基础与进化研究,通过随机森林结合群体异常值分析方法,对美国哥伦比亚河和普吉特湾14个种群的414个个体、9107个RAD标记进行分析,识别出33个预测位点,解释79.2%的性状变异,揭示洄游时间表型的遗传机制及平行进化路径。 文件详解 基因型输入文件...
-
Exposure_Database_Based_喜马拉雅邦建筑滑坡暴露度评估数据
数据集概述 本数据集为喜马拉雅邦滑坡风险建筑暴露度数据库,基于随机森林、支持向量机、多层感知机模型生成的滑坡敏感性地图,整合建筑数据识别建筑暴露水平,覆盖该地区多个区县的建筑滑坡风险分布统计,为规划和决策提供支持。 文件详解 文件名称:new_UPDATED.xlsx 文件格式:XLSX...
-
Data_driven_Based_全球土壤一氧化氮排放数据驱动估算研究补充数据
数据集概述 本数据集为“基于优势植被覆盖的全球土壤一氧化氮排放数据驱动估算”研究的补充文件,包含原位观测数据、数据驱动模型代码、DNDC模拟文件及所有图表的支持数据。原位观测涵盖192个站点的1356条土壤NO排放记录,数据驱动模型提供3种机器学习方法,DNDC模拟含51个站点文件,共8个文件。 文件详解 图表支持数据(Figures...
-
NO3_ensemble_based中国环境硝酸盐浓度长期趋势数据2005_2015
数据集概述 本数据集包含2005至2015年中国逐月硝酸盐(NO3-)浓度数据,通过集成随机森林(RF)、梯度提升决策树(GBDT)和极端梯度提升(XGBoost)机器学习模型生成,模型输入包含卫星数据、同化气象数据及其他地理协变量。数据分辨率为0.25°,总计包含两个文件。 文件详解 readme.txt 文件格式:TXT...
-
EEG_Based_精英柔道运动员Alpha神经反馈训练与力量适应研究数据2024
数据集概述 本数据集关联精英柔道运动员Alpha神经反馈训练研究,包含去标识化的原始及处理后EEG数据(F3、F4电极及前额叶阿尔法不对称指数)、5种相对负荷下的下肢力量表现指标、响应者分类标签、训练分组、增量指数,以及用于统计与机器学习分析的R脚本,支持基于EEG的力量提升预测及响应者状态分类研究。 文件详解...
-
Machine_learning_Source_扫描参数对随机测量误差影响预测研究数据
数据集概述 本数据集是“Machine-learning method for predicting the scanning parameters influence on random measurement error”研究的配套数据,包含六份文件,涉及扫描参数对随机测量误差影响的预测模型及相关数据,支持机器学习方法在该研究场景下的验证与应用。...
-
EEG_Alpha_Neurofeedback_精英柔道运动员力量增益预测数据_2024
数据集概述 本数据集伴随研究“Machine Learning Identification of EEG Predictors of Load-Specific Strength Gains Following Alpha Neurofeedback in Elite...
-
Metascape_Prostate_Cancer_Based多组学数据特征提取分析结果
数据集概述 本数据集是前列腺癌多组学数据的Metascape分析结果,为论文补充文件,曾用于AI对抗癌症数据科学黑客松。核心内容基于张量分解的无监督特征提取方法,针对特征数超10万、样本量约100的多组学数据,筛选出生物学可靠的基因,相关方法性能优于随机森林等传统监督特征选择方法。 文件详解 文件名称:all.tix6y75jj.zip...
-
Csw_Acetone_Based_表层海水丙酮浓度月度气候态预测数据_v20190916a
数据集概述 本数据集为基于观测训练的随机森林机器学习算法预测的表层海水丙酮浓度月度气候态数据,水平分辨率为0.9°×1.25°,可用于计算丙酮的双向海气交换通量。训练数据来自多项船舶观测研究,算法细节参考Wang等(2019)。 文件详解 Csw_Acetone_f09f09_Monthly_WangJGR2020_v20190916a.nc...
-
APVV_Obsidian_Based_斯洛伐克尼特拉新石器时代遗址黑曜石器物化学成分分析数据
数据集概述 本数据集包含斯洛伐克Nitra-Selenec早期新石器时代遗址黑曜石器物及喀尔巴阡山脉黑曜石参考样本的ED-XRF化学成分分析数据。通过R语言环境进行预处理(包括数据导入、异常值过滤、成分归一化、缺失值插补)、标准化及来源分类,采用随机森林模型开展溯源研究,最终通过可视化呈现结果,为黑曜石器物的来源追溯提供数据支持。 文件详解...
-
Spatial_Estimation_Based_土壤有机质与全氮空间估算数据_原始数据与代码
数据集概述 本数据集包含土壤有机质与全氮空间估算研究的原始数据及核心代码,整合了高分一号(GF-1)遥感数据和田间可见-近红外(vis-NIR)光谱数据,用于支持土壤属性预测模型构建与性能评估,共包含6个文件。 文件详解 文档文件 文件名称:readme file.docx 文件格式:DOCX...
-
Neuron_Numbers_Based_鸟类神经元数量与脑大小及创新性关联研究数据_2022
数据集概述 本数据集基于一百一十一种鸟类的神经元数量估算,探究鸟类创新性与绝对及相对脑大小的关联。数据核心内容包括鸟类分类信息、神经元数量、脑及身体形态测量、创新性指标等,同时提供配套分析代码,支持验证神经元数量通过发育调节连接认知表现与脑大小的研究结论。 文件详解 数据文件 文件名称:KSepka_grades.csv 文件格式:CSV...
-
Production_and_perception_Based_社交情境笑声产生与感知研究数据集
数据集概述 本数据集为论文“Production and perception of volitional laughter across social contexts”的配套数据,包含研究分析文档、笑声音频文件、数据分析文件、听众识别任务数据、说话人数据、R分析脚本及可视化文件,全面记录社交情境下笑声产生与感知的实验及分析结果。 文件详解...
-
Lake_Area_Spatial_Heterogeneity_中国湖泊面积干旱响应机制研究数据
数据集概述 本数据集源自论文《Spatial heterogeneity and driving mechanism of the response of lake area to drought for lakes in...
-
T2D_Falls_Prediction_Based_2型糖尿病患者跌倒预测因素机器学习分析数据
数据集概述 本数据集为2型糖尿病患者跌倒预测因素的纵向研究数据,包含316名筑波大学医院住院糖尿病患者的医疗史、实验室数据、体能评估及出院后一年跌倒情况问卷结果,通过逻辑回归和随机森林模型分析跌倒风险因素,共1个文件。 文件详解 文件名称:ClinicalDemogData02.xlsx 文件格式:XLSX...
-
Hawaii_Native_Vegetation_Vulnerability_未来气候场景分析数据
数据集概述 本数据集包含夏威夷原生植被在未来气候场景下的脆弱性评估结果,涵盖单一分类和多类别随机森林输出。数据记录了原生植被类型在未来NCAR RCP 8.5场景下的分布变化、潜在重叠区域及多类别植被分布,支持分析植被范围的收缩、扩张及共存可能性。 文件详解 单一分类植被未来分布文件(如nds_future.tif、nwf_future.tif等)...
-
Multidimensional_trait_morphology_蚂蚁多维形态特征与生态位预测数据
数据集概述 本数据集围绕蚂蚁多维形态特征与生态位的关联展开研究,涵盖110属160余种蚂蚁的形态测量数据及生态分类信息。通过整合筑巢微生境、觅食层和功能角色形成35种生态位组合,结合主成分分析、线性判别分析和随机森林等方法,分析形态特征对生态位的预测能力,最终简化为10种生态形态综合征,为蚂蚁生态形态学研究提供支撑。 文件详解...
-
Sensor_based_detection_蔬菜加工用茄科莎草科杂草传感器检测数据_博士论文第三章
数据集概述 本数据集包含M.Lauwers博士论文第三章的相关数据与脚本,主题为基于传感器的蔬菜加工用茄科和莎草科杂草检测。数据涵盖正则化逻辑回归系数、分光光度计数据、随机森林脚本等14个文件,用于支持杂草检测算法的研究与实现。 文件详解 数据文件(.xlsx格式,共8个)...
-
MentalHealth_SocialNetworks_Based_社交媒体心理健康评论多维度标注数据集
数据集概述 本数据集包含两个Excel文件及相关文档、代码,核心为社交媒体心理健康评论标注数据。数据源自Instagram平台名人心理健康披露相关帖子的评论,共2287条,分别标注了极性、污名属性及情感类别,同时提供机器学习分类模型代码,支持社交媒体心理健康相关文本分析研究。 文件详解 数据文件 文件名称:DatasetMH.xlsx...



