重磅!Google釋出全球天氣模型預報基準WeatherBench 2,推動機器學習氣象應用發展
Google發布WeatherBench 2框架,用于評估基于機器學習和物理學的天氣預報模型,其提供完整且統一的評估方式,可促進天氣預報技術創新
Google釋出了一個用于評估和比較各種天氣預報模型的框架WeatherBench 2,該框架可以計算包括機器學習模型和物理模型的天氣預測分數,使研究人員有微調和改進模型的依據。官方還開源WeatherBench 2評估代碼,以及針對云端優化的真實數據和基準數據集。
由于天氣預測技術的發展發向,正從物理模型逐漸轉移到機器學習模型,因此需要模型基準來評估模型間的能力,并確保機器學習模型值得信任。隨著運算能力提升,Google提到,當今7日天氣預報的準確性,相當于2000年的5日預報,也相當于1980年的3日預報,這些預測準確度的提升,對物流規劃、災害管理、農業甚至是能源,都有極大的價值。
不過,除了運算能力的提升外,當前另一股天氣預測的變革從算法開始,較新的方法是使用機器學習技術,通過查看大量過去的天氣數據,預測接下來天氣的變化,有別于現行基于物理模型的天氣預測,是以數學方程式描述和模擬大氣、海洋、陸地和相關過程的動態和互動。
機器學習天氣預測目前已經有部分成果,像是Google DeepMind所開發的圖神經網絡GraphCast,就可以在25公里的水平分辨率下,預測10日天氣,結果也已經可以和先進的物理模型相比較。
機器學習模型的重要優勢,在于模型經過訓練之后,可以僅使用成本遠低于超級計算機的硬件運算,在數分鐘內計算出結果,而這對天氣預報領域帶來重大的效率提升和成本降低的可能性,因此無論是在歐洲中期天氣預報中心(ECMWF)的機器學習發展路線,還是美國國家海洋暨大氣總署(NOAA)的人工智能戰略都可見端倪。
在發展機器學習天氣預測上,需要一個能夠反應天氣和下游應用各面性質的基準,而且能夠以公平且可重復的方式比較新舊模型。Google所推出的WeatherBench 2全球天氣模型基準,可提供一個可信、可重復的框架,評估和比較不同的預測方法。目前WeatherBench 2官方網站公開的模型比較,包含Keisler、GraphCast和Pangu-Weather機器學習模型,還有一些ECMWF高分辨率整合預報系統,作為傳統天氣預報模型的代表。
天氣預報的評估存在一些挑戰,因為高分辨率的天氣預報數據可能非常龐大,因此Google在開源統一程序開發模型Apache Beam上建置評估代碼,供用戶將運算分割成小區塊,以分布式的方式進行評估。另外,Google 針對不同分辨率,并以云端最佳化的數據格式,提供用來訓練大多數機器學習模型的ERA5資料集,官方提到,因為從各別檔案下載數據并進行轉換,非常耗時且需要大量運算資源,因此透過公開已經就緒的資料,可以大幅降低研究進入門檻。
Google與ECMWF合作,共同定義了天氣預報質量評分指標,更好地捕捉全球天氣預報的質量,WeatherBench 2能夠以同一標準評估不同的模型,包括機器學習模型與物理模型。除此之外,WeatherBench 2也考慮到更先進的概率預測,提供概率指標和基準。
比起傳統「明天下雨機率80%」,概率預測可以提供不同情境下的概率分布,像是「明天降雨量在0-10毫米的機率為60%,10-20毫米的機率為20%」這類預測,以捕捉更多天氣預報的不確定性。
同時,WeatherBench 2也針對機器學習預測的限制,提供研究范例,Google解釋,機器預測模型相對物理模型,在大氣不確定性上傾向采取保守策略,這會讓預測更為平滑(下圖),因此與真實情況不一致缺乏真實性,同時缺乏小尺度的結構。WeatherBench 2對此提供了研究范例,并且添加光譜指標來量化模型的模糊性,以評估模型是否傾向預測平滑的場景。
研究人員仍會繼續完善WeatherBench 2,添加包括站點觀測和降水數據集,并且嘗試將臨近預報和次季節預測納入基準中。
來源:ithome
- 上一篇:沒有啦
- 下一篇:重磅!Google釋出全球天氣模型預報基準WeatherBe 2023/9/7