数据集概述
本数据集包含西班牙西北部青贮玉米产量与品质估算的相关数据与代码,对应论文“A machine learning approach for estimating forage maize yield and quality in NW Spain”。数据涵盖2000-2022年7个地点的1449条生产记录,包含产量、品质等目标变量及14个输入变量;代码为用于预测的Jupyter Notebooks。
文件详解
- 代码文件(.ipynb格式,共4个)
- 文件名称:
V7_DM_RFR_LGBM_XGB_OPTUNA_SHAP_PERMU_kgDM_RAD_Dia_Export.ipynb、V7_UFL_RFR_LGBM_XGB_OPTUNA_SHAP_PERMU_kgDM_RAD_Dia_Export.ipynb、V7_CP_RFR_LGBM_XGB_OPTUNA_SHAP_PERMU_kgDM_RAD_Dia_Export.ipynb、V8_BoostrappingRFR_LGBM_XGB_OPTUNA_SHAP_PERMU_kgDM_RAD_Dia_Export.ipynb
- 内容:分别用于青贮玉米干物质(DM)、单位饲料乳糖能(UFL)、粗蛋白(CP)产量预测,以及结合Bootstrapping的干物质产量预测,采用集成机器学习方法(RFR、LGBM、XGB)并包含优化与解释模块
- 数据文件(.xlsx格式,1个)
- 文件名称:
260324_ENG_MaizeForageSpainNWwtYearRadDay.xlsx
- 字段:包含14个输入变量(地点、年份、品种、播种日期等)和3个目标变量(kg DM/ha、UFL/ha、kg CP/ha)
- 文档文件(.md格式,1个)
- 文件名称:
README.md
- 内容:数据集与代码的说明文档,介绍项目背景、文件结构及使用指引
数据来源
论文“A machine learning approach for estimating forage maize yield and quality in NW Spain”
适用场景
- 青贮玉米产量预测模型开发: 利用机器学习方法构建西班牙西北部青贮玉米干物质、粗蛋白等产量的预测模型
- 农业生产决策支持: 基于环境与管理变量分析,为青贮玉米种植的品种选择、播种时间优化提供数据支持
- 作物品质影响因素研究: 探究气候、土壤等输入变量对青贮玉米品质(如粗蛋白含量)的影响机制
- 农业机器学习方法应用: 验证集成学习、Bootstrapping等方法在作物产量估算任务中的效果与稳定性