基于Catboost和Stacking融合模型的 長江中下游短時臨近降水預報研究
來源:宋慧娟,等
摘 要
Abstract
用中國自動站與CMORPH降水產品融合的逐小時降水量網格數據集、全球預報系統(Global Forecasting System, GFS)模式再分析資料,將機器學習特征算法篩選的特征變量作為模型輸入數據,運用Catboost模型和以Catboost和隨機森林為初級模型、徑向基神經網絡為次級模型的融合模型預測未來6 h累計降水等級,并應用公平TS評分(Equal Threat Score,ETS)、真實技巧評分(True Skill Statistic,TSS)、混淆矩陣、預報偏差(Bias值)、擊中率(Probability of Detection,POD)對預報結果進行檢驗分析。結果表明:優化變量的輸入有利于提高模型的準確率;Catboost模型和融合模型都可以在一定程度上辨別晴雨狀況;僅非動力學變量參與的融合模型對雨區預報準確率最高,但容易將暴雨雨區預報得更加廣泛?傮w而言,融合模型具有更強、更穩定的預報性能,中到暴雨量級預報準確率還待進一步提高。
關鍵詞
Keywords
中文關鍵詞:
機器學習
短時臨近預報
長江中下游
降水
融合模型
英文關鍵詞:
machine learning
short-range forecast
the middle-lower reaches of the Yangtze River
precipitation Stacking model
文內圖片
圖1 模擬區域及地形
圖4 Stacking集成學習算法
圖7 6月24日(b—d) 00—06時、(f—h)06—12時和(j—l)12—18時的6 h累計降水量級Catboost模型預報結果: (a、e、i) 實況; (b、f、j)輸入動力學變量預測; (c、g、k)輸入非動力學變量預測; (d、h、l)輸入完整變量預測