当前位置:主页 > 业界动态 > WEB3.0 > DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

2023-01-03 10:13:34来源:互联网

文章导读
新智元报道 编辑:好困 Aeneas 【新智元导读】 「中期天气预报」因为数据量太大,预测模型的质量一直是个难题。最近,DeepMind和谷歌推出的全新机器学习模型,以超过99%的优势在天气预报模 ...

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气


新智元报道

编辑:好困 Aeneas【新智元导读】「中期天气预报」因为数据量太大,预测模型的质量一直是个难题。最近,DeepMind和谷歌推出的全新机器学习模型,以超过99%的优势在天气预报模型中胜出。
众所周知,传统天气预报的可靠性,多少都有些一言难尽。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

最近,DeepMind和谷歌新研究出了一种基于机器学习的天气模拟器,可以在60秒内预测10天内的天气,而且准确率极高!

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

论文地址:https://arxiv.org/abs/2212.127941. GraphCast是一种基于图神经网络的自回归模型,性能优于世界上最准确的机器学习天气预报系统(中期天气预报)2. GraphCast只需单台Cloud TPU v4设备,即可在60秒内生成10天内的天气预报(35GB数据),分辨率高达0.25°;3. 通过在更大、更新、质量更高的数据上进行训练,可以进一步提升GraphCast预测的速度和准确性。

中期天气预报为什么那么难

「中期天气预报」通常是指对未来于4至10天内天气变化趋势的预报。其准确性,对于农业、建筑业、旅游业等行业的政策制定来说至关重要。

为此,国际领先的欧洲中期天气预报中心(ECMWF), 每天都会提供多达四次的中期天气预报。在中期天气预报的制作过程中,有两个关键的组成部分都需要利用大规模高性能计算(HPC)集群进行模拟:

通过分析由卫星、气象站、船舶等收集的当前和历史数据来预测天气状况,也就是「数据同化」;

通过数值天气预报(NWP)系统建立预测天气相关变量将如何随时间变化的模型。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

然而,随着数据量的显著增加,NWP模型却无法得到有效的扩展。也就是说,虽然现在有大量的天气和气候观测档案,但我们却很难直接利用这些数据来提高预报模型的质量。而改进NWP的方法,一般是由训练有素的专家手动创造更好的模型、算法和近似值,这个过程耗时耗力,成本高昂。相比之下,基于机器学习方法可以利用更多、更高质量的可用数据来提高模型的准确性,而且计算预算通常要低得多。

GraphCast

在论文「GraphCast:中期全球天气准确预报学习」中,DeepMind以「编码-处理-解码」的方式使用图神经网络(GNN)来创建一个自回归模型。

GraphCast的三阶段模拟过程如下:1. 使用从网格点到多网格的有向边的GNN,将原始经纬度网格的输入数据映射到多网格上的学习特征中;2. 一个深度GNN被用来在多网格上进行学习的信息传递,其中长距离的边允许信息在空间上有效传播;3. 解码器将最终的多网格表示映射回经纬度网格,并执行任何必要的操作。研究结果显示,GraphCast的性能在252个变量中,有99.2%超过了现有最准确的机器学习天气预报模型;在2760个变量中,有90%超过了欧洲气象中心的高精度预报(ECMWF HRES Forecast)。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

(a) 输入的天气状态是在高分辨率的纬度-经度-气压层网格上确定的。(b) GraphCast预测天气的下一个状态是纬度-经度-压力级网格。(c) 通过迭代地将GraphCast应用于每个先前的预测状态,以产生一连串的状态,将天气表示为连续的提前量。(d) GraphCast架构的编码器组件将输入的局部区域(绿色方框)映射到多网格图的节点。(e) 处理器组件使用所学的消息传递来更新每个多网格节点。(f) 解码器组件将经过处理的多网格特征(紫色节点)映射到网格表示上。ERA5数据集 GraphCast在39年(1979年-2018年)历史天气数据的语料库上进行了训练,即ECMWF的ERA5再分析数据集。模型以6小时的时间步长,在0.25°经纬度分辨率下,对5个地表变量和6个大气变量进行10天的预测,每个变量在37个垂直压力层上,代表了特定地点和时间的天气状态。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

如图1a所示,研究人员将时间指数t处的天气状态表示为

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

环绕地球的网格对应每个纬度、经度和压力级别的变量。表面和大气变量分别由放大视图中的黄色和蓝色框表示。我们将

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

中对应于特定网格点(总共有1,038,240个)的变量子集称为

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

,并将227个目标变量中的每个变量称为

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

生成预测

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

GraphCast 将两个天气状态

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

作为输入,它们分别对应当前时间t,和前一个时间t-1,并预测下一个时间步长的天气状态(如图1b所示)。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

为了生成T-step预测

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

,GraphCast以自回归方式迭代上图的等式,将自己的预测作为输入,来预测后面的步长(即,预测步长t+2,输入为

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

预测步长 t + 3,输入为

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

图1b、c描述了这个过程。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

架构 GraphCast的核心架构在「编码-处理-解码」配置中使用GNN,如图1d、e、f所示。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

基于GNN的学习模拟器在学习流体和其他材料的复杂物理动力学方面非常有效,因为它们的表示和计算结构类似于有限元学习求解器。GNN的一个关键优势是,输入图的结构决定了表示的哪些部分通过学习的消息传递相互交互,从而允许在任何范围内进行任意模式的空间交互。相比之下,卷积神经网络 (CNN) 仅限于计算局部patch内的交互(或者,在扩张卷积的情况下,有规律地跨越更长的范围)。而Transformer虽然也可以完成任意的远程计算,但是在输入非常大的情况下,它们不能很好地扩展(要知道,GraphCast的全局输入中有超过100万个网格点),因为计算中all-to-all的交互,会引起很复杂的二次记忆。Transformer的当代延伸通常会稀疏化可能的交互,以降低复杂性,这使它们实际上类似于GNN。通过引入GraphCast的内部多网格表示,研究人员利用GNN的能力,模拟了任意稀疏的交互方式。它在全局范围内具有均匀的空间分辨率,并允许在少数消息传递步长内进行长距离互动。要构造一个多网格,首先要将一个常规的二十面体(12个节点和20个面)迭代6次,得到一个二十面体网格的层次结构,在最高分辨率下共有40,962个节点和81,920个面。因为粗网格节点是细网格节点的子集,研究人员能够将网格层次结构中的各级边缘,叠加到最小分辨率的网格上。这个过程产生了一个多尺度的网格集,粗边在多个尺度上弥合了长距离,细边捕捉了局部的相互作用。图1g显示了每个单独的细化网格,而图1e显示了完整的多网格。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

使用具有从网格点到多网格的定向边的GNN,GraphCast的编码器(图1d)首先将原始经纬度网格的输入数据,映射为多网格上的学习特征。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

然后,处理器(图1e)使用一个16层的深度GNN,在多网格上进行学习的信息传递,由于长距离的边缘,信息可以在空间上被有效传播。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

然后,解码器(图1f)使用具有定向边缘的GNN,将最终的多网格表示映射回经纬度网格,并将该网格表示+与输入状态+相结合,形成输出预测,++1 = + + +。

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

训练过程 GraphCast被训练成在12步预测(3天)中对ERA5目标进行目标函数最小化,使用的是梯度下降法。目标函数如下——

DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气

研究人员使用批处理并行技术,在32台Cloud TPU v4设备上花了大约3周时间对GraphCast进行了训练。为了减少内存占用,研究人员还使用了复杂的梯度检查点策略和低精度的数值。
热门文章
日榜 周榜
1 3月6日投资晚报|证监会:鼓励上市公司一年多次分红,上海电力

周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...

2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车

2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...

3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场

界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...

4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念

3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...

5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生

界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...

1 3月6日投资晚报|证监会:鼓励上市公司一年多次分红,上海电力

周三(2024年3月6日),A股市场早盘低开,午后开始反弹。上证指数涨上证指数跌0.26%,报3039...

2 金股挖掘| 绑定大众集团实现业务腾飞,电车时代来临,这家车

2023年我国汽车产业发展取得突破性进展,全年产销均超3000万辆,创历史新高,汽车出口首次跃...

3 调研早知道| 自有品牌战略进入全面收获期,这家企业海外市场

界面新闻记者 | 袁颖琪 跟随着我国白电“走出去”的步伐,有一家企业的优势正日益凸显。这...

4 盘中必读|今日共105股涨停,三大指数小幅下跌,新质生产力概念

3月6日,大盘午后震荡回落,三大指数均小幅下跌。截至收盘,沪指跌0.26%,深成指跌0.22%,创...

5 重大事项停牌前一度大涨17%,“量子通信第一股”国盾量子发生

界面新闻记者 | 冯雨晨 一番大涨之后,国盾量子(688027 .SH )宣布筹划重大事项停牌,引起市...

撤稿申请|

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有