找回密码
 立即注册
搜索
楼主: PRTF

[数值预报] Google的新AI模型——FGN的原理

[复制链接]

3

主题

25

回帖

282

积分

热带低压

积分
282
 楼主| 发表于 2025-6-23 17:23 | 显示全部楼层
PART4 试验的过程
训练与评估数据:团队采用两个数据集对FGN模型展开训练,分别是ERA5和HRES。在ERA5上,团队选取了数据集子集构建“预训练”的数据集,这些数据集以1小时间隔记录了1959年以来的静态地面要素和大气要素的数据,具有0.28125°的分辨率,覆盖了13个气压层,分别是:50hPa,100hPa,150hPa,200hPa,250hPa,300hPa,400hPa,500hPa, 600hPa,700hPa,850hPa,925hPa和1000hPa,时间总从1979.1.1-2018.1.15,采样为6小时间隔(00Z,06Z,12Z,18Z)。在HRES上,团队采用HRES-fc0,包含每日初始的预报结果,且采用ECMWF最新的数值预报模式进行同化。另外,在HRES中,团队做了相关填补,即在ERA5数据集中例如SST在陆地上的数据会被标记成NaN,而在HRES中,团队采用最小海温对数据进行填补。
评价方法:1.评价边缘预测分布能力:通过计算集合均值的均方根误差(RMSE)和CRPS来评估边缘分布,在每个位置都把这两者指标计算出来,然后在全球范围内取均值。再者,利用传播技能比率(spread-skill ratio)来刻画可靠性和离散度。此比率小于1则说明模型过度自信,反之则说明信心不足。最后采用REV来量化概率预测模型在天气决策中的价值,具体为:观察预测分布是否超过某要素的阈值。
          2.评价联合分布的相关性结构:其一是评估空间的预测性和依赖性,其二是通过CRPS评估跨变量的依赖性,其三是将预报的求谐功率谱形成报告,将观测值和HRES-fc0的数据进行对比。
          3.评价热带气旋路径:团队采用两个指标评估模型在热带气旋路径的预测能力,以及预测路径的REV。位置误差的计算基于的标准是国际气候管理最佳路径档案库(IBTrACS),然后建立一个追踪器来预测热带气旋路径。当预测路径在初始场前一段时间与标准位置相差在100km内即认为位置预测“有效”
科里奥利力

3

主题

25

回帖

282

积分

热带低压

积分
282
 楼主| 发表于 2025-6-23 17:26 | 显示全部楼层
本帖最后由 PRTF 于 2025-6-23 18:38 编辑

PART4 试验结果
  边缘数据预测技能与结果:      
  如图所示是FGN与Gencast的边缘数据预测比对,图a是评分卡,蓝色则说明FGN在要素-气压层-时间组合上取得了更优的CRPS,而红色则说明Gencast在要素-气压层-时间组合上取得更优的CRPS。可见,FGN在99.9%的目标上表现的都比Gencast更为突出。最高的CRPS提升了18%,平均CRPS提升6.5%。另外从g和h两幅图中可见,在10米风上REV表面FGN比Gencast更优,而在2米风上二者相当。从b-f可见,FGN的也具有较高的校准性,离散-校准度)评分(spread-skill score)都接近于1。(10m与2m最大风速下的模型REV评估比较,包含超越阈值等。FGN基本上保持高REV或与Gencast相当)
联合分布相关结构的结果:
  如图可见FGN在不同尺度上相较于Gencast的平均池化和最大池化平均值分别上升8.5%和7.5%,右图a到b是预报时效1天与7天的评分卡。从图中可见虽然两者均有降低,但FGN的池化CRPS更大,表明更具优势。从3c与3d的观测要素比对中可见,在评测10米径向风和切向风时,FGN比Gencast的精准度大4.8%,在z300-z500上其更优7.8%,凸显了FGN的跨要素依赖关系的较高程度。且从球谐功率上看更优,避免了高功率损失。(注:池化是卷积神经网络CNN和循环神经网络RNN中的一种操作,目的是减少数据空间大小来防止过拟合,提高数据的鲁棒性)
热带气旋路径预测的结果:
  Gencast提前2天预测的大致结果,FGN提前3天即可预测得到。图4a中加入了12h一预报的FGN预报版本以消除时间跨度对模型的影响,结果表明,FGN的误差虽有增加,但从2天起的预报时效误差仍然低于Gencast。且FGN在路径概率预报方面也优于Gencast,REV也更大。表明FGN在热带气旋预报的实际业务中展现出了良好的实用性。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
科里奥利力

3

主题

25

回帖

282

积分

热带低压

积分
282
 楼主| 发表于 2025-6-23 18:42 | 显示全部楼层
PART5 总结
  研究结果表明,FGN模型相较于以往的机器学习模型在边缘预测分布能力、联合分布相关性结构和热带气旋路径的预测等方面均有显著改进,它采用独立训练模型集合来捕捉认知不确定性,并能轻松地进行自回归训练。
最显著的研究成果是联合分布协方差,原因是其中涉及到的随机性的一系列步骤和转换方式,正是因为前面所讲的条件归一性的相关设置,使得随机性的源头被束缚在很小的范围内,而输出分布又可以覆盖很大范围,需要注意的是,这与输出网格的分辨率无关。但是模型仍存在不足和局限性:1. 处理器网格结构的“蜂窝状”结构,这种结构将出现在一些输出中,这些输出一般具有较小损失权重,如图所示 2. 模型的随机种子经过特定训练之后仍会产生多次不稳定的结果。

总而言之,FGN建模过程为天气预报中的AI模型提供了一种新的通用方法,该方法具有可拓展性,标志着AI将统计学方法应用于复杂的学习问题之一方面取得了关键进展。

补充与讨论:1.模型的训练过程是多阶段的,团队利用二次采样将6小时一报调整为12小时一报进行了实验,大气与地面要素的累计量(如累计降水量)会进行重新统计。
2. 模型的超参数
3.团队还对FGN做了个消融实验(Ablations),如接下来的两幅图所示,上图表示团队分别采用与FGN相同的时间报点、相同的基本模型数、相同的容量来进行CRPS测试,结果显示,FGN基本上会比Gencast更优,可以更有效的捕捉到空间和要素的相关性;下图是对热带气旋轨迹概率预测上的相对误差方差(REV),由图可见,FGN的多种变体都在预测中占优,同时,前文所述的增加的自回归训练可以进一步提升REV指标。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
科里奥利力

3

主题

25

回帖

282

积分

热带低压

积分
282
 楼主| 发表于 2025-6-23 18:43 | 显示全部楼层
附:该模型(FGN)的系集预报(FNV3)与之前的Gencast可查看另一位气象爱好者制作的网站——菜园子天气栈https://www.smca.fun/nwp_TC_forecast_ai_FNV3_ensemble.html

参考文献:
[1]Ferran Alet, Ilan Price, Andrew El-Kadi, Dominic Masters, Stratis Markou , Tom R. Andersson , Jacklynn Stott , Remi Lam , Matthew Willson , Alvaro Sanchez-Gonzalez and Peter Battaglia.Skillful joint probabilistic weather forecasting from marginals[EB/OL].Google Deepmind,2025-6-13.
[2]Balaji Lakshminarayanan Alexander Pritzel Charles Blundell.Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles[EB/OL].Google Deepmind,2017-12-4.
[3]Anonymous authors.FUNCTIONAL RISK MINIMIZATION[EB/OL].Under review as a conference paper at ICLR 2023,2023-2-1.
科里奥利力

3

主题

25

回帖

282

积分

热带低压

积分
282
 楼主| 发表于 2025-6-23 19:06 | 显示全部楼层
完结!
科里奥利力

72

主题

826

回帖

3066

积分

管理员-厄尔尼诺

积分
3066
QQ
发表于 2025-6-25 20:07 | 显示全部楼层
感觉楼主这个写的太复杂了,他本身是一个很直观的东西,架构大概就是:
Spatial input*2(X t, X t-1) concat (x pres level, grid size) -> GNN enc -> latent(768, latent dim) -> Model AR pred X t+1 -> GNN dec -> Output

fCRPS什么的我讲意义也不大,可能还没AI讲的明白,整体上这个模型更像是把近期的成果想法集中在一起,scale一下模型,加一点trick得来的,没有什么重大的创新点,但是他确实是效果好
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|TY_Board论坛

GMT+8, 2025-8-21 06:10 , Processed in 0.051696 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表