Nature子刊 | AI驅動氣候模式精準預測季節性降水
原創 ClimAI智慧氣象
今天分享一篇2021年發表在Communications Earth & Environment上的《Training machine learning models on climate model output yields skillful interpretable seasonal precipitation forecasts》,這篇文章探討了使用機器學習模型分析氣候模擬輸出以進行季節性降水預測的可行性。由于觀測數據樣本量有限,這限制了機器學習在該領域的應用。為解決這個問題,作者在大規模氣候模型集合上訓練了各種機器學習方法。在數千個模擬季節上訓練后,這些機器學習模型被用來在1980-2020年的歷史期間進行季節預報測試。
結果顯示,這些基于機器學習的模型能夠與或勝過現有動力學模型,并能識別出導致預測技能的相關物理過程。
一:引言
美國西部季節性降水預測面臨數據有限、變率大的挑戰。少數幾個大氣河流事件常導致年際間降水變化,難以預報。ENSO是北美季節預報的主要預測因子,但其信噪比偶爾導致意外。印度洋也調節著ENSO對北美降水的影響。捕捉這些遠距離影響及交互作用對提高預測技能至關重要。
目前預測方法主要有動力學模擬、統計模型和混合方法。動力學集合預報已展示一定的預測技能。而統計方法常面臨數據不足限制。本研究嘗試在氣候模型集合上訓練機器學習模型,以擴大樣本量。通過廣泛的機器學習模型測試、可預測模式的聚類及可解釋性分析,試圖提高預測技能并理解預測背后的物理機制。
二:數據及其方法
文章利用了CESM-LENS氣候模型,它提供了從1920年到2005年的40個集合成員的數據。關于觀測和再分析數據,包括ERSSTv5海表溫度、ERA5數據以及CPC統一的降水數據。關鍵的氣候預測變量,通過EOF分析降維處理,著重于海表溫度和高空風場。
1. 變量選擇和處理: 采用經驗正交函數(EOF)分析對海表溫度(SST)和高空風場等關鍵氣候變量進行降維,以突出最重要的氣候信號。
2. 降水模式識別: 通過K均值聚類方法分析CESM-LENS數據,識別西美地區的季節性降水模式。
3. 機器學習模型的應用: 使用包括隨機森林、XGBoost、神經網絡和長短期記憶(LSTM)網絡在內的多種機器學習模型進行季節性降水預測。
4. 可解釋性分析: 通過相對平均減少精度、平均最小樹深度和根節點頻率等指標分析隨機森林模型,以及通過局部可解釋不可知模型LIME框架對局部預測提供解釋。
5. 與動力學模型的比較: 將機器學習模型的預測結果與北美多模型集合(NMME)動力學模型的結果進行對比,評估各自的預測效果。
圖1季節性聚類預測方法
三:結果
使用機器學習模型對CESM-LENS數據進行訓練和校準后,這些模型在預測觀測記錄中的季節性降水模式方面顯示出一定的準確性。雖然準確性整體上是有限的,但與隨機猜測模型和最常見群集預測相比,仍然顯示出一定的技能。特別是,在將降水模式進行分組后,預測準確性有所提高。此外,不同的季節和降水模式預測能力有明顯差異,某些模式比其他模式更易于預測。
圖2:各種機器學習模型與NMME模型準確性比較
解讀隨機森林模型
通過分析隨機森林模型在預測季節性降水方面,發現熱帶太平洋海表溫度異常和高空速度勢異常是關鍵預測變量。研究還揭示了這些變量與降水模式之間的關系,顯示ENSO是主導西美降水預測的主要因素,但其他變量也對預測有獨立貢獻。這些發現提高了對機器學習模型預測邏輯的理解,支持了其在季節性降水預測中的應用。