通过机器学习预测作物产量
今天分享一篇文献解读,将围绕论文《结合机器学习和环境变量约束气候变化下作物产量变化预测的不确定性》展开,该研究通过将动态线性模型(DLM)和随机森林机器学习模型(RF)分别与9个全球网格作物模型(GGCM)集成来整合和克服这两种建模框架的缺点,以改善玉米和大豆预测的不确定性。
研究目的
1、通过从历史数据中再现观察到的玉米和大豆产量来提高模型的性能。
2、研究作物产量对ECE和CPD风险的非线性响应。
3、在未来气候情景下,比较GGCM单独的产量预测与混合模型的产量预测。
研究方法
-
随机森林机器学习模型 -
NWAI-WG统计降尺度方法 -
动态线性模型
玉米模拟模型包括9个模型(CARAIB、EPIC-TAMU、JULES、GEPIC、LPJ-GUESS、LPJmL、pDSSAT、PEPIC和PROMET)
大豆模拟模型包括8个模型(CARAIB、EPIC-TAMU、JULES、GEPIC、LPJmL、pDSSAT、PEPIC和PROMET)
研究人员收集1999-2010年间155个站点的玉米产量试验数据和50个站点的大豆产量试验数据。
首先,将ggcm模拟器的输出、环境变量(ECEs和cpd)以及作物产量观测数据(从155个玉米和50个大豆站点收集)整合到动态线性模型(DLM)和随机森林(RF)模型中构建混合模型。
然后,使用混合模型来预测气候变化下的作物产量(由GCM驱动的GGCM模拟器计算)、ECEs(基于GCM)和CPDs。最后,比较GGCM模型和杂交模型的作物产量预测和不确定性来源。
研究结果
GGCM对作物产量的模拟精度较低,玉米的r值为0.15~0.61。nRMSE为0.18~0.50;大豆的r值为0.37~0.70,nRMSE为0.17~0.35。
杂交模型(GGCM+RF)表现出显著的改善,玉米的r范围为0.64~0.77,nRMSE范围为0.13~0.17;大豆的r范围为0.54~0.70,nRMSE范围为0.17~0.2。
用RF模型生成PDP,以证明环境因素与作物产量之间的非线性关系,对6个环境因子的相对重要性进行归一化处理,结果表明,玉米的主要影响因子为CD(33.5%)和CPD(23.4%),大豆的主要影响因子为CPD(22.6%)和TD(19.5%)。
对SSP126和SSP585下1980-2099年玉米和大豆产量变化的时间序列分析表明,GGCMs和杂交模型(GGCM+RF)预测玉米产量将大幅下降,特别是在2040年之后。
在SSP126情景下,GGCM模型预测2040年后大豆产量将呈上升趋势,而GGCM+RF模型预测2040年后大豆产量将呈下降趋势。
SSP585情景下,GGCM预测大豆产量将从2050年左右开始下降,而GGCM+RF模型预测的产量下降时间更早。
GGCM和GGCM+RF模拟预测了玉米产量的下降,两者预测的相似性表明GGCM模拟器充分反映了某些极端气候条件下的产量损失。
综上所述,作者团队成功开发了混合模型(GGCM+RF),通过考虑ECEs和CPD,将机器学习与作物模型相结合,从而提高了玉米和大豆产量预测的准确性,同时降低了整体的不确定性。
本文由 mdnice 多平台发布