数据集概述
本数据集为“公共育种对未来气候情景下美国水稻产量的积极影响”研究的配套资源,包含美国南部水稻主产区(阿肯色等五州)的气候、遗传、产量及品种种植面积数据,以及用于产量预测的PCA模型、元机器学习模型和Python脚本,支持水稻产量与气候、遗传因素关系的分析与预测。
文件详解
- 数据文件
- 名称:Acreage_Variety_Germplasm_information.xlsx、Genotype_info_original.csv、CVG_yearly.csv、Future_weather.csv、Allele_frequency_Data.csv、NASS_yield.csv、Variety_Acreage.csv、URRN_weather.csv、historical_weather.csv
- 格式:CSV、XLSX
- 字段:包含水稻品种种植面积、基因型信息、年度气候-品种-产量关联数据、未来气候预测、等位基因频率、历史产量、品种面积分布、试验站气候等字段
- 模型文件
- 名称:meta_learner_ridge.pkl、PCA.pkl、meta_learner_xgb.pkl
- 格式:PKL
- 说明:PCA数据转换模型、两种元机器学习预测模型
- 代码文件
- 名称:creating_traning_source.py、model_developement_predictions.py、create_CVG.py
- 格式:PY
- 说明:训练数据集创建、模型开发预测、CVG数据生成脚本
- 压缩文件
- 名称:cvg_response.zip
- 格式:ZIP
- 说明:CVG响应数据压缩包
数据来源
USDA NIFA项目(2014-67003-21858、2022-67013-36205)支持的研究
适用场景
- 农业气候适应性研究:分析未来气候情景下美国水稻产量变化趋势
- 水稻育种效果评估:量化公共育种对水稻产量气候抗性的提升作用
- 产量预测模型开发:基于遗传、气候数据构建和验证水稻产量预测模型
- 农业政策制定:为美国水稻主产区应对气候变化的种植策略提供数据支持
- 遗传-环境互作分析:探究水稻等位基因频率与气候因子对产量的联合影响