新闻资讯

为区域气候影响和适应研究选择观测受限的全球气候模型集合的方法

1 简介
全球气候模型(GCM)——包括纳入生物地球化学循环的地球系统模型——由越来越多的气候建模小组继续并行开发和改进(Chen 等人,引用2021 年;政府间气候变化专门委员会,引用2013)。在气候变化的背景下,历史和未来 GCM 模拟的多模式集成 (MME) 通过世界气候研究计划耦合模式比对项目 (CMIP) 进行协调,该项目开发了用于评估历史模式性能的通用实验协议集并了解模型对气候强迫的响应(O'Neill 等人,引用2016年;泰勒等人,引用2012)。CMIP 第五阶段 (CMIP5) 包括 30 多个 GCM 的贡献,由 20 多个国际建模小组开发(Taylor 等人,引用2012)。在撰写本文时,CMIP 的第六阶段 (CMIP6) 提供了来自 30 多个机构的 40 多个 GCM 的模拟(Eyring 等人,引用2016)。MME 可用于研究由于复杂地球系统的 GCM 表示的结构差异而导致的气候响应的不确定性范围(例如 Flato 等人,引用2013年;政府间气候变化专门委员会,引用2012)。同时,MME中的初始条件集合可用于表征内部变异性,这是由于气候系统在不同空间和时间尺度上的自然、混沌行为而产生的不可减少的不确定性(例如Deser等人,引用2012年;郑等人,引用2022年,引用2023;莱纳等人,引用2020 年;乌达尔等人,引用2018)。

模型民主原则(一个模型一票),假设独立性和同等合理性,为所有模拟赋予相同的权重(Flato 等人,引用2013年;克努蒂和塞德拉切克,引用2013年;彭内尔和赖克勒,引用2011年;桑德森等人。引用2015a),已用于量化 MME 中未来气候预测的集合平均值和分布(不确定性范围)。值得注意的例子包括政府间气候变化专门委员会 (IPCC) 第四次和第五次评估报告(AR4 和 AR5)的结果,这些报告基于参与 CMIP3 和 CMIP5 的模型(Meehl 等人,2007 年;IPCC,引用2013),分别。然而,此类 MME 本质上并不是为了采样不确定性而设计的,而是由愿意做出贡献的建模小组提供的模拟组合而成(Tebaldi 和 Knutti,引用2007)。因此,这些 MME 是“机会集合”,包括初始条件成员、次要版本变体(例如具有不同的分辨率)或具有共享代码或整个组件的模型;因此,模拟通常不是独立的,并且可能具有共同的偏差(Knutti & Sedláček,引用2013年;桑德森等人。引用2015a)。此外,GCM 再现不同地区观测到的气候特征的能力也不同(Cannon、引用2020 年;艾林等人。引用2020 年;乔治和梅恩斯,引用2003年;克努蒂等人,引用2017b;奥弗兰等人,引用2011)。

人们已经研究了替代方法,通过根据 GCM 的历史表现和依赖性特征对 GCM 进行过滤、约束或加权来提高未来气候预测的可靠性。这些基于绩效的方法基于两个主要假设:(1) 与观察结果一致性较差的模型应被过滤掉或减少加权(例如 Brunner 等人,引用2020b ; 克努蒂等人,引用2017b;桑德森等人。引用2015b)和(2)在每个模型中,现实的历史模拟和可靠的未来预测之间都存在新兴关系(例如 Caldwell 等人,引用2018年;克努蒂等人,引用2017a;塞尔滕等人,引用2020 年;托卡尔斯卡等人。引用2020)。对于未来的气候预测,一些研究探索了过滤过程(例如 Mendlik 和 Gobiet,引用2016年;Notz 和 SIMIP 社区,引用2020 年;奥弗兰等人,引用2011年;帕丁等人。引用2020),加权方案(例如 Brunner 等人,引用2020b ; 克努蒂等人,引用2017b;梁等人,引用2020 年;桑德森等人。引用2015b)基于模型性能和相互依赖性,以及观察约束的应用(即 Nijsse 等人,引用2020 年;里伯斯等人,引用2021 年;托卡尔斯卡等人。引用2020)基于 GCM 对外部强迫的历史敏感性。IPCC第六次评估报告(AR6)应用了各种统计加权方法来结合MME预测(Lee等人,引用2021)。

对未来气候变化的可靠预测对于国家和区域规模的影响评估、适应规划和政治决策至关重要;GCM 提供满足这些需求的信息(Brunner 等人,引用2020a;乔治和古托斯基,引用2016年;休伊特和洛,引用2018年;祖布勒等人。引用2016)。在所有条件相同的情况下,最好使用尽可能多的 GCM 模拟来捕获模型不确定性和样本内部变异性的全部范围。然而,即使所有模型都同样可信,有限的研究资源迫使区域影响评估的研究人员和特定领域环境模型(例如区域气候模型、水文模型、作物模型、生态系统模型等)的建模者使用模型的子集。 GCM(大炮、引用2015年;可汗等人,引用2020 年;麦克斯威尼等人,引用2015年;奥弗兰等人,引用2011年;徐等人,引用2019)。在区域研究中也考虑使用 GCM 子集来解决其他限制,例如模型预测之间缺乏一致性、时间或空间分辨率不足、偏差和数据集大小(Bartók 等人,引用2019年;门德利克和戈比特,引用2016)。例如,协调区域降尺度实验 (CORDEX) 是一个旨在通过完全协调的实验协议生成全球高分辨率区域气候预测的框架,它从选定的驱动 GCM 子集(Giorgi 和 Gutowski、引用2016)。

在这种情况下,子集选择的目标是确定一个较小的、有代表性的 GCM 集,它可以从 GCM 整体中再现气候特征和未来预测范围(Mendlik & Gobiet,引用2016)。例如,一些研究应用了自动化方法,对气候极端指数的预测变化进行聚类,作为识别 GCM 代表性子集的手段(例如 Cannon、引用2015年;法贾德等人,引用2019年;徐等人,引用2019)。子集选择可以纳入基于绩效的标准,例如通过消除关键流程代表性不足或历史绩效较差的模型。类似地,可以通过删除冗余模型、共享代码或模型组件或具有共同偏差的模型来减少集成(Sanderson 等人,引用2015a)。然而,一般来说,选择过程是一个具有挑战性的问题,因为消除模型会减少预测的不确定性范围,这可能导致决策者过度自信和潜在的适应不良(例如 McSweeney 等人,引用2015年;梅兹加尼等人,引用2019)。此外,历史表现与未来气候变化之间的联系可能很弱;因此,就未来气候变化而言,表现“最佳”的模型可能并不是最现实的(Knutti,引用2010年;门德利克和戈比特,引用2016)。此外,评估历史 GCM 性能高度依赖于比较的设置,包括变量和区域的选择、空间和时间尺度以及性能统计(例如 Jury 等人,引用2015)。

已使用基于性能的标准为世界上许多国家和大陆范围的区域选择了用户定制的未来气候预测集合(例如德国、Dalelane 等人,引用2018年;韩国,Seo 等人,引用2019年;瑞士、Sørland 等,引用2020 年;北欧,Parding 等人,引用2020)。加拿大全国范围内很少有类似的例子。Mahony 等人在加拿大和美国的次大陆地区。(引用2022)选择了一个代表 CMIP6 MME 中平衡气候敏感性、网格分辨率和瞬态区域气候变化分布的 GCM 系综。钱等人。(引用2021)应用基于包络的方法和自动聚类方法,通过考虑温度和降水方面的气候变化信号范围来选择 GCM 集合,以预测加拿大各地的油菜籽和春小麦产量。

在这里,我们提出了一个实验框架,用于从 38 个 CMIP5 和 43 个 CMIP6 GCM 中选择代表性的模拟子集,重点关注加拿大各地年度和季节时间尺度的不同区域尺度。选择过程侧重于 GCM 在地表气温、降水和海平面压力方面的历史表现,而且重要的是,与两次全球重新分析相比,最近的变暖趋势。我们使用基于代议制民主方法的选择过程(Leduc 等人,引用2016年;桑德森等人。引用2015a)来解释具有相同名称但空间分辨率或耦合组件不同的次要变体之间的相互依赖性。通过将气候预测的总体平均值和分布与使用所有模型运​​行的全套(即模型民主)获得的结果进行比较来评估选择框架。提供了模型性能(带有排名)和相互依赖性的标准化衡量标准,以帮助指导用户选择 CMIP5 和 CMIP6 GCM 进行加拿大各地的区域影响评估。

2 数据与方法
全球气候模拟和再分析数据集
本研究使用 CMIP5 GCM 在两种代表性浓度路径 (RCP) 情景(RCP4.5 和 RCP8.5)下进行历史模拟(1985-2005)和预测(2006-2100)(Collins 等人,引用2013)。RCP4.5 是描述 2100 年之后稳定情景下 4.5 Wm -2辐射强迫的轨迹,对应于 2081-2100 年全球平均表面温度增加 1.8°C [可能范围为 1.1°C 至 2.6°C]相对于 1986 年至 2005 年。RCP8.5代表2100年辐射强迫大于8.5 Wm -2 的高排放情景,对应于同期全球气温升高3.7°C [可能范围为2.6°C至4.8°C]。本研究采用了所有当前可用的运行,包括来自较小变体和初始条件集合的模拟,这导致来自 38 个 GCM 的 RCP4.5 总共 105 次运行,RCP8.5 总共 125 次运行(表格1有)。

这里使用的 CMIP6 多模型集成(MME)包括两个共享社会经济路径(SSP)情景(SSP245 和 SSP585)下的历史模拟(1985-2014)和预测(2015-2100)(Riahi 等人,引用2017)。SSP245 是 RCP4.5 的修改情景,描述了一个在适应和减缓方面面临中等挑战的世界,对应于 2081 年全球平均地表温度增加 2.0°C [可能范围为 1.4°C 至 3.0°C] 2100 年相对于 1995-2014 年(Lee 等人,引用2021)。SSP585 是 RCP8.5 的更新情景,假设世界面临缓解方面的高挑战和适应方面的低挑战,对应于全球气温上升 4.0°C [可能范围为 2.7°C 至 5.7°C]时期(Lee 等人,引用2021)。本研究使用了所有当前可用的模拟,其中 SSP245 运行了 125 次,SSP585 运行了 149 次,来自 43 个 GCM(表格1b).

GCM 的月平均近地表 (2 米) 气温 (SAT)、累积降水量 (PR) 和平均海平面压力 (PSL) 是从地球系统网格联盟 (ESGF) 节点下载的。CMIP5 的运行通过代表实现 ( r )、初始化方法 ( i ) 和物理版本 ( p ) 的rip索引来区分,而 CMIP6 的运行通过ripf索引来引用,该索引还指定了强制数据集 ( f )。所有气候变量均使用一阶保守重映射方法从其原始分辨率重新网格化为通用 2.5°×2.5° 网格(Schulzweida,引用2019)。这三个气候变量的组合通常用于评估 GCM 模型(例如 Walsh 等人,引用2008年;沃特森等人,引用2014)并开发加权方法(例如 Brunner 等人,引用2020a;桑德森等人。引用2017)。SAT 和 PR 是 GCM 必须准确模拟的最基本变量,因为它们决定地球气候,并与其他重要气候变量密切相关,包括湿度、云量和大气环流。PSL 已用于评估 GCM 准确表示大气环流的能力。准确表示大气环流和高/低压变化对于捕捉主要区域气候特征至关重要(Cannon、引用2020 年;费尔南德斯-格兰哈等人,引用2021)。

两次全球重新分析的输出 – 欧洲中期天气预报中心 (ECMWF) ERA5(Hersbach 等人,引用2020)和国家环境预测中心/国家大气研究中心(NCEP/NCAR)再分析1(Kistler等人,引用2001)——用作观测约束数据集,用于评估历史 GCM 性能。ERA5是ECMWF基于0.3°水平分辨率综合预报系统开发的最新(第五代)大气再分析数据集,涵盖1950年至今。ERA5 的每月气候变量插值到本研究中使用的常见 2.5°×2.5° 网格。从 1948 年到 NOAA 地球系统研究实验室气候诊断中心 ( http://www.cdc.noaa.gov ),所有 NCEP/NCAR 变量均可以 2.5° 水平分辨率获取。该数据集是广泛使用的全球大气再分析数据集,用于研究长期气候变率和变化(例如Fu等人,引用2015年;拉蒙等人,引用2019)。通过解决气温、降水、湿度和压力方面的问题和错误,数据集不断更新。( https://psl.noaa.gov/data/reanalysis/problems.shtml)。

b 绩效和相互依赖性衡量标准
为了评估 GCM 的性能和相互依赖性,使用了一组措施来解决目标区域和时间尺度内与参考数据的一致性的不同方面(重新分析性能或另一个 GCM 的相互依赖性),如下所示:

气候平均值的面积加权均方根误差 (RMSE)。RMSE 表示 GCM 和参考数据之间的气候平均值的平均距离。

气候标准差 (SD) 的面积加权 RMSE。RMSE 表示 GCM 和参考数据之间的年际变异性的平均距离。

月平均值年周期的 RMSE 面积平均值。RMSE 表示 GCM 的年度周期与参考数据之间的平均距离。

SAT 线性趋势的 GCM 面积加权 RMSE。RMSE 代表 GCM 和参考数据之间变暖趋势的平均距离。

因此,我们计算了 1985-2014 年参考期的 10 个绩效指标(SAT_mean、PR_mean、PSL_mean、SAT_sd、PR_sd、PSL_sd、SAT_cycle、PR_cycle、PSL_cycle 和 SAT_trend)。

ERA5 和 NCEP/NCAR 的平均值用作观察值。这遵循了 Brunner 等人的建议。(引用2020b),他们使用两个观测数据集的组合,在基于性能的 GCM 加权方法中产生更稳定的结果。对于每次 GCM 运行,RMSE 距离是根据 GCM 观测对计算的,并且 GCM 的初始条件系综成员的平均 RMSE 距离用于评估。GCM 的相互依赖性是通过使用另一个 GCM 作为参考从 GCM-GCM 对计算出的 RMSE 距离来定义的。因此,GCM-观测对或 GCM-GCM 对的 RMSE 较大,分别表示性能较差或相互依赖性较弱。对于每个性能测量,GCM 观测 RMSE 或 GCM-GCM RMSE 的最终分布按其中值(最大值 + 最小值)/2 进行缩放。然后,通过算术平均值,将单独测量的 GCM 的缩放 RMSE 合并为性能或相互依赖性的单个测量。多个性能指标的综合 RMSE 距离以相同的方式缩放。绩效指标是在加拿大陆地和六个加拿大次区域计算的(如图。1有)。后者在加拿大第三次国家评估(加拿大政府,引用2001)并考虑气候和行政区域。多项研究(例如引用2020b ; 郑等人,引用2020 年;布什和莱门,引用2019年;加农等人,引用2020 & Jeong & Cannon,引用2020a)利用加拿大的六个次区域进行区域气候变化影响评估。

c 模型选择框架
研究人员通常很难提前确定特定影响和适应研究中所需使用的情景数量(Farjad 等人,引用2019)。这里通过根据 CMIP5 和 CMIP6 系综的缩放 RMSE 排名选择 10 个 GCM 来演示选择代表性模拟子集的框架。这个近似子集大小是根据 Pennell 和 Reichler 得出的(引用2011年)他表明,当应用于 24 个 GCM 的多模型集成时,基于模型性能的选择程序会产生大约 7-9 个模型的子集。本研究中引入的框架选择的子集与 1985 年至 2100 年期间的民主模式(即使用假设独立性和同等合理性的所有模型运​​行)进行比较。我们还假设每个初始条件集合的平均值用于模型民主和模型选择。由于单个变量和绩效衡量标准对于特定区域评估可能或多或少重要,因此还评估了选择过程对不同绩效衡量标准组合的敏感性。我们研究所选子集的稳健性和潜在的过度自信,引用2019年;布伦纳等人,引用2020b ; 里伯斯等人,引用2021)。

3 个结果
a 历史模拟以及与未来预测的联系
我们首先展示了 1985-2014 年期间各个 GCM 运行(包括各个初始条件集合成员)的气候平均值 SAT、PR 和 PSL 之间的分布和关系,空间尺度范围从全球到加拿大次区域尺度(如图。1b),这是选择过程中使用的绩效衡量标准之一。显示了重新分析的气候平均值以供参考。SAT 和 PR、PR 和 PSL 以及 SAT 和 PSL 之间的三个散点图用于呈现成对变量之间 GCM 气候学平均值的一般关系。图中呈现了具有不同空间分辨率、共享成分和初始条件成员的所有微小变体的气候学,以显示它们的一致程度。

两次重新分析的气候平均值通常位于 GCM 范围的中间,这表明由于通过平均减少了系统偏差,多模型平均值通常会优于任何单个模型(Knutti,引用2010)。GCM 模拟显示了 SAT 和 PR 之间的气候平均值在统计上显着的正相关关系——全球和国家(加拿大)尺度上的线性关系明显强于区域(北方)尺度(R 平方值为 0.45、0.22、和 0.10 ,分别)。这表明高估气候 SAT 的 GCM 也往往高估 PR。气候PR和PSL之间存在负相关关系(全球和国家尺度的R平方值为0.30和0.18)。PSL 的正偏差通常与低估 PR 相关。同样,在全球和国家尺度上,气候 SAT 和 PSL 之间存在显着的负相关关系,表明 SAT 的正偏差与低估 PSL 相关。

初始条件成员或次要变体通常表现出相似的气候学手段;与国家(加拿大)和区域(北方)规模相比,这种一致性在全球范围内更高。例如,具有不同水平分辨率的型号(例如 HadGEM3-GC-31-MM 和 HadGEM3-GC-31-LL、MPI-ESM1-2-HR 和 MPI-ESM1-2-LR、CNRM-CM6-1 和 CNRM- CM6-1-HR 等)以及共享代码或模型组件(例如 MIROC-ESM 和 MIROC-ESM-CHEM、CanESM5 和 CanESM5-CanOE、CESM2 和 CESM2-WACCM 等)对于这三个组件表现出相似的气候学平均值。变量。因此,由于包含较小的变体,CMIP5 和 CMIP6 MME 内可能会出现冗余。初始条件成员(例如 CSIRO-Mk3-6-0 为 10 个、CanESM5 为 20 个、MIROC6 为 20 个等)

将各个 GCM 运行模拟的近期变暖趋势与 1985-2014 年从全球到区域尺度的两次重新分析中的趋势进行了比较(如图。2)。这一时期的温度变化主要是对温室气体强迫的响应,因此 SAT 趋势可能是限制未来变暖的一个很好的指标(Liang 等人,引用2020 年;奈杰斯等人,引用2020)。与两次重新分析相比,GCM 模拟了全球范围内平均更高的变暖趋势,这主要是由于几个“热门模型”(例如 CanESM2、HadGEM3-GC-31、CanESM5、UKESM1-0-LL 等)存在较大的正偏差。 )。然而,变暖趋势对加拿大和北方的偏见较小,众所周知,这些地区的变暖趋势高于全球范围(IPCC,引用2013年;李等人,引用2021)。与图中所示的气候平均值相比,较小的变体和初始条件成员的变暖趋势不太一致如图。1b. 据报道,来自同一中心的 GCM 或仅对物理参数化进行小幅调整的 GCM 可能对外部强迫具有不同的气候敏感性(Jiménez-de-la-Cuesta 和 Mauritsen,引用2019年;奈杰斯等人,引用2020)。最近 SAT 变暖的幅度与全球、加拿大和加拿大次区域范围内 CMIP5 和 CMIP6 MME 的预计未来温度变化幅度显着相关(如图。2)。在全球范围内,这一结果与Liang等人的研究结果一致。(引用2020)针对SSP585下的CMIP6 MME的情况。在两种情景和所有空间尺度上,CMIP6 MME 中历史变暖和未来变暖之间的关联比 CMIP5 MME 中的类似模拟更强。这可能是由于 CMIP6 中存在具有更高气候敏感性的 GCM。因此,CMIP6 GCM 在模拟近期 SAT 变暖的能力方面的性能是限制未来预计变化的重要措施,不仅在全球范围内,而且在加拿大和加拿大次区域。

b 性能和模型间依赖性
针对空间尺度、时间尺度和性能测量的不同组合,给出了 GCM 和重新分析之间的缩放 RMSE(及其等级)(如图。3)。对于具有多个初始条件成员对 MME 做出贡献的 GCM,显示了成员的缩放 RMSE 的平均值。举一个例子,使用所有绩效指标,GFDL-CM4 在年度时间尺度上展现了加拿大最佳的整体绩效 (Canada.ann.all);多项单独测量均表现出色,包括 PSL_mean、PSL_cycle、SAT_sd、SAT_cycle 和 SAT_trend。几个较小的模型变体属于 Canada.ann.all 的前 10 名最佳模型,其中包括 EC-Earth3 的四个变体(EC-Earth3-CC、EC-Earth3、EC-Earth3-Veg 和 EC-Earth3-Veg-LR) )、GFDL 的两个变体(GFDL-CM4 和 GFDL-ESM4)以及 CESM2 的两个变体(CESM2 和 CESM2-WACCM)。

GCM 显示了加拿大各个绩效指标的缩放 RMSE 差异(第 1-10 列),这表明模型绩效取决于气候变量和指标。这一发现与桑德森等人的观点一致。(引用2017)北美地区的年度时间尺度。GCM 在不同的空间尺度上也表现出不同水平的性能。例如,EC-Earth3-CC在加拿大排名第3,在全球范围内排名第13,在全球排名第28。根据年度时间尺度统计数据评估大西洋地区。这种稳定性的缺乏部分是由于在较小空间尺度上性能测量估计中固有的较低信噪比造成的。但总的来说,CMIP6 GCM 的性能优于 CMIP5 GCM。对于 Canada.ann.all 的情况,与 CMIP5 GCM 相比,CMIP6 GCM 产生的 RMSE 平均小 10%。即使包含了具有夸大 SAT 变暖响应的离群 GCM,CMIP6 GCM 平均显示,在年度时间尺度上,加拿大 SAT 变暖趋势的 RMSE 仍小 6.0% (Canada.ann. SAT_trend)。然而,在全球范围内,平均 RMSE 比 CMIP5 大 3.0% (Global.ann.SAT_trend) (如图。2有)。

就模型相互依赖性而言,多个 GCM(例如 CMIP5 MME 中的 BNU-ESM 和 inmcm4,以及 CMIP6 MME 中的 KIOST-ESM 和 MCM-UA-1-0)似乎与 MME 中的其他 GCM 强烈独立(如图。4),而较小的变体(例如CMIP5中的MPI-ESM-LR和MPI-ESM-MR,以及CMIP6中的CanESM5和CanESM5-CanOE等)往往彼此强烈依赖。初始条件成员之间的相互依赖性通常比次要变体之间的相互依赖性更强(未显示)。来自不同机构但具有共同模型组件(例如 CMIP6 的 HadGEM3-GC31-LL 和 UKESM1-0-LL)的 GCM 被正确识别为相似,尽管依赖性程度通常弱于共享相同模型名称的次要变体之间的依赖性。这一结果清楚地表明,MME 中 GCM 的相互依赖性导致历史模拟和未来预测的冗余。这些结果与 Sanderson 等人的发现一致。(引用2017),用于北美的 CMIP5 MME,由 Brunner 等人完成。(引用2020b)全球范围内的 CMIP6 MME。

c 受观察结果限制的预测
为了证明选择过程对未来预测的影响,在使用 CMIP6 GCM 的 SSP245 和 SSP585 情景下,对加拿大 1985-2100 年期间三种不同情况(每种情况使用不同的绩效衡量组合)的年平均 SAT 进行了比较(如图。5)。这三种情况是:(1)模型民主(即假设独立性和平等合理性),包括所有模型运​​行,包括初始条件成员和次要变体的平均值;(2)基于历史变暖的代议制民主,其中包括使用SAT_trend的RMSE选择的10个模型;(3) 基于整体历史绩效的代议制民主,其中包括使用所有绩效指标的 RMSE 选定的 10 个模型。后两种情况中选择的 10 个模型基于初始条件集合成员的平均 RMSE,并且仅包括次要变体中表现最好的模型。例如,对于 SAT_trend,GFDL-ESM4 被选为性能最佳的模型;由于与 GFDL-ESM4 高度相互依赖,GFDL-CM4(第三佳)被排除在外(如图。4b). 同样,在包括所有性能指标但排除其变体的情况下,选择 GFDL-CM4、EC-Earth3-Veg、CESM2-WACCM、MPI-ESM1-2-HR 和 CNRM-CM6-1。

1985-2014 年期间,所有模型运​​行的整体在加拿大的年度 SAT 成绩中表现出很大的差异;集合成员的气候平均值变化范围约为 5.5°C。模型民主方法导致参考期的模型存在很大的不确定性。然而,与两次重新分析相比(ERA5 和 NCEP/NCAR 的气候平均值分别为 -3.7°C 和 -3.7°C,增长趋势分别为 +0.47°C/十年和 +0.52°C/十年),平均值捕捉了加拿大年度 SAT 的主要统计特征(气候平均值为 -3.7°C,增长趋势为 +0.57°C/十年)。对于历史参考期,基于 SAT_trend 选定的 10 个模型导致年度 SAT 的集合分布比完整模型集合的集合分布小 49%。一般,这些选定的模型捕获了近期变暖趋势 [+0.55°C/十年] 和该时期观测到的年度 SAT 的气候平均值 [−4.1°C],尽管仅使用 SAT_trend 选择。最后,根据所有性能指标选择 10 个模型,年度 SAT 的集成分布比完整模型集成的分布小 56%。平均而言,所选模型再现了最近的变暖趋势 [0.55°C/十年] 以及使用 SAT_trend 选择的模型,同时还更接近地再现了历史参考期观测到的年度 SAT 的气候学 [−3.8°C]。根据所有性能指标选择 10 个模型,年度 SAT 的集成分布比完整模型集成的分布小 56%。平均而言,所选模型再现了最近的变暖趋势 [0.55°C/十年] 以及使用 SAT_trend 选择的模型,同时还更接近地再现了历史参考期观测到的年度 SAT 的气候学 [−3.8°C]。根据所有性能指标选择 10 个模型,年度 SAT 的集成分布比完整模型集成的分布小 56%。平均而言,所选模型再现了最近的变暖趋势 [0.55°C/十年] 以及使用 SAT_trend 选择的模型,同时还更接近地再现了历史参考期观测到的年度 SAT 的气候学 [−3.8°C]。

模型民主方法导致了 SSP585 下 2071-2100 年加拿大最大的年度 SAT 预测(中位数为 4.1°C,整体分布范围为 -1.2°C 至 9.4°C)。然而,根据 SAT_trend 选择的 10 个模型预测年度 SAT 值较低(中位数为 2.6°C,比所有模型运​​行的总体平均值低 1.7°C),范围较小(−1.2°C 到6.8°VS)。显然,通过集合分布来衡量 SAT 未来预测的部分不确定性源于参考期的不确定性。这与之前的发现一致(例如 Brunner 等人,引用2020b ; 梁等人,引用2020 年;托卡尔斯卡等人。引用2020)发现受观测限制的未来变暖估计值低于没有观测限制的估计值。特别是,所有模型运​​行的上限都大大减少了 SAT_trend 的子集。上限较大的不确定性是基于碳循环-气候反馈的不确定性,这在变暖程度较高时影响更大,并且气候敏感性上限的不确定性更大。(克努蒂等人,引用2008年;梁等人,引用2020)。GCM 模拟显示气候敏感性与气候变化的许多方面之间存在线性比例关系。然而,仅仅依赖这种线性关系会使许多复杂的方面过于简单化。尽管如此,气候敏感性仍然是气候预测不确定性的最大因素,使其成为模型选择中的重要诊断。根据所有性能指标选择的 10 个模型预计加拿大的平均 SAT 略高于根据 SAT_trend 选择的模型,但 SAT 低于整个整体(中位数为 3.6°C,范围为 -1.1°C 至 9.4°C) )。然而,在这种情况下,减少的系综几乎再现了 SSP585 下本世纪末加拿大民主模式的全部预测不确定性。对于SSP245(如图。5b) 另一方面,加拿大年度 SAT 中值预测的排序与 SSP585 相同(模型民主最温暖,其次是所有绩效指标,然后是 SAT_trend 最冷),而整体分布大幅减少对于这 10 个模型集合而言,基于历史性能的选择将所有测量和 SAT_trend 的子集中的模型不确定性分别降低了 40% 和 27%。

迄今为止公布的结果主要集中于年度 SAT 的未来预测。为了显示结果如何推广到降水量,针对所有模型运​​行以及基于 SAT_trend 和 SSP245 和 SSP585 下的所有绩效测量选择的 10 个模型,呈现了 2071-2100 年相对于 1985-2014 年的年度 SAT 和年度 PR 的预计绝对变化的散点图。全球范围内,加拿大以及加拿大的六个次区域(如图。6)。基于 SAT_trend 的缩放 RMSE,所有绩效指标及其排名均显示在如图。3。年度 SAT 和 PR 的预计变化表明,在全球范围内,加拿大以及魁北克、大西洋和北部次区域存在很强的正相关关系,而加拿大其他次区域的正相关关系较弱。一般来说,未来年度 SAT 的增长幅度越大,未来年度 PR 的增长幅度也越大。对于 SAT 预测的年度变化,根据 SAT_trend 选择的 10 个模型导致 SSP245 和 SSP585 下大西洋次区域的增幅较高,并且在一些次区域中它们也比整个集合产生更高的增幅,例如魁北克和大西洋均采用 SSP245 和 SSP585,北部则采用 SSP585。然而,基于 SAT_trend 的子集通常显示年度 SAT 中值变化的增幅低于加拿大和其他加拿大次区域的所有测量值或完整集合的绝对变化。对于年度 PR 预测,与加拿大和加拿大次区域的完整整体相比,基于 SAT_trend 和所有度量的 10 个选定模型导致中值变化大约有 10% 的差异。同样,考虑到年度 PR 和 SAT 变化之间的正相关关系,SAT_trend 的子集显示绝对变化的增幅大于根据次区域年度 PR 的所有衡量标准选择的子集,这些子区域的年度 SAT 增幅较高。然而,

基于加拿大和北部次区域绩效衡量的不同组合,使用子集(10 个选定的模型)进一步研究了代议制民主方法(如图。7)。这里考虑了六种绩效指标的组合;(1) 仅 PR_mean [W1],(2) 仅三个 PSL 测量值 [W2],(3) 仅三个 SAT 测量值 [W3],(4) 除 SAT_trend 之外的所有测量值 [W4],(5) 仅 SAT_trend [W5] ,以及 (6) 所有十项措施 [W6]。很明显,与两次重新分析(即 ERA5 和 NCEP/NCAR)相比,仅受 PR_mean 约束的子集 W1 产生无偏中位数,并且与参考期年度 PR 的其他子集相比,产生最小的分布范围。同样,与参考期的完整集合相比,受 SAT_mean、SAT_sd 和 SAT_cycle 约束的 W3 子集在年度 SAT 中显示出明显较小的模型不确定性。然而,不受年度 PR 测量约束的子集 W2、W3 和 W5 会产生较大的年度 PR 模型不确定性。类似地,子集 W1、W2 和 W5,不受年度 SAT 测量的限制,与子集 W3 相比,年度 SAT 产生更大的模型不确定性。仅基于 SAT_trend 的子集 W5 会产生年度 SAT 和 PR 的冷偏差。基于除 SAT_trend 之外的所有度量的子集 W4 在再现中位数和降低年度 SAT 和 PR 的完整集合的模型不确定性方面显示出良好的结果,以供参考。然而,包含 SAT_trend 作为绩效衡量指标的子集 W6 在年度 SAT 和 PR 方面显示出比子集 W4 更低的中位数和更大的差异,以供参考。这些模式也存在于加拿大其他次区域(未显示)。鉴于相对于子集(10 个 GCM)而言,GCM MME 成员(43 个 GCM)数量较多,就参考期的中位数、上四分位数和下四分位数的分布而言,留一法交叉验证结果与其子集非常相似。这表明所选择的子集可能不会受到过度自信的影响。

与 2071-2100 年期间 SSP245 和 SSP585 下的年度 SAT 的其他子集相比,子集 W4 显示出与完整集合相似的中位数和较小的价差。同样,在未来的两种情况下,与其他子集相比,子集 W1 会产生与完整集合相似的中位数和更小的年度 PR 值。然而,在 SSP245 和 SSP585 下,W1 和 W2 的子集比年度 SAT 的子集 W3 产生更大的利差,而子集 W2 和 W3 也比年度 PR 的子集 W1 预测更大的利差。这些结果表明,基于基于绩效的代议制民主方法(即 当基于与目标变量间接或弱相关的绩效测量来选择子集时,考虑到模型之间的相互依赖性)不能有效地减少气候变量的未来预测不确定性。这些结果还清楚地表明,未来预测不确定性的一部分可能源于参考期内的模型不确定性。仅受 SAT 变暖趋势约束的子集 W5 产生的中位数低于不受约束的完整集合或受未来年度 SAT 和 PR 的其他绩效指标约束的子集;与参考期相比,未来这些差异要大得多。在年度 SAT 和 PR 的预测中,子集 W4 和 W6 通常显示出与完整集合相似的中位数。对于未来的年度 SAT,它们大多产生比子集 W3 更大的价差,但比子集 W1、W2 和 W5 更小的范围。类似地,对于未来的年度 PR,子集 W4 和 W6 通常导致比子集 W1 更大的分布,但比子集 W2、W3 和 W5 更小的范围。这些结果表明,与通过直接相关的绩效衡量标准选择的子集相比,通过一系列绩效衡量标准(包括与目标变量直接和间接相关的变量)选择的子集在降低气候变量的预测不确定性方面效率较低到目标变量。然而,子集 W4 和 W6 通常提供比受与目标变量弱或间接相关的性能测量约束的子集更好的预测。再次,加拿大其他次区域也观察到了这些模式(未显示)。留一法交叉验证在未来的预测中也显示出与其所选子集类似的结果,表明它们在这些预测中的稳健性。然而,可以考虑使用完美模型方法进行更复杂的交叉验证。在这种方法中,来自 MME 的单个集合成员的模拟充当伪观测。随后,具有不同性能测量组合的选择方法可以应用于伪观察。覆盖概率,表示所选模型的投影范围包含真实值(即伪观测值的投影)的次数比例,引用2021)。

4 总结与讨论
本研究研究了针对目标区域(加拿大和六个加拿大次区域)和时间尺度(年度和季节性)的基于绩效的方法,同时考虑了初始条件集合成员和模型的较小变体之间的相互依赖性(例如,具有不同的模型组件或空间)决议)。绩效衡量包括相对于使用 PR、PSL、SAT 计算的全球重新分析的缩放 RMSE,以及来自 38 个 CMIP5 和 43 个 CMIP6 GCM 的近期 SAT 变暖趋势。

来自同一气候模拟中心的 GCM 的小变体(例如 CMIP5 的 MPI-ESM-LR 和 MPI-ESM-MR,以及 CMIP6 的 CanESM5 和 CanESM5-CanOE 等)表现出彼此之间很强的相互依赖性,如GCM-GCM 成对 RMSE 距离 (如图。4)。GCM 的初始条件集合成员之间通常表现出比次要 GCM 变体更强的一致性(如图。1)。初始条件成员和次要变体通常在最近 SAT 变暖趋势方面表现出较少的一致性(如图。2)比气候平均值(如图。1)。然而,最近的 SAT 变暖趋势与 CMIP5 和 CMIP6 GCM 的未来变暖显着相关,如加拿大和加拿大北部所示(如图。2)。这表明 GCM 模拟近期变暖趋势的能力可以有效限制加拿大各地未来的预计变化,这与梁等人的研究结果一致。(引用2020)和托卡尔斯卡等人。(引用2020)在全球范围内。特别是梁等人。(引用2020)报告称,使用观测到的变暖趋势限制的全球变暖显示出与无约束总体相似的平均变化,但相对于 1970-2014 年,根据 SSP585,2081-2100 年的预测上限降低了 0.6°C。托卡尔斯卡等人。(引用2020年)发现,受观测到的变暖趋势的限制,未来2081年至2100年的全球变暖相对于1995年至2014年将降低约0.6°C。

鉴于初始条件成员和次要 GCM 变体之间存在高度相互依赖性,本研究使用初始条件集合成员的集合平均值来衡量性能,并仅包括表现最好的次要模型变体(即代议制民主),以减少所选模型中的冗余。 GCM 的子集。仅基于 SAT_trend 的 10 个选定模型预计,相对于 2071-2100 年 SSP245 和 SSP585 下加拿大和六个加拿大次区域的所有模型,年度 SAT 较低(无花果。5和7)。特别是,基于 SAT_trend 的子集预计 2071-2100 年 SSP585 下加拿大的年 SAT 比整个集合低 1.7°C。使用与目标气候变量直接相关的绩效测量(例如年度 PR 的 PR_mean 和年度 SAT 的 SAT_mean)选择的子集能够减少参考期的模型不确定性以及未来的预测不确定性(如图。7)。然而,受与目标变量间接相关的绩效测量(例如年度 SAT 的 PR_mean)约束的子集无法正确再现平均变化信号并量化未来预测的不确定性。这些结果强调了在观察受限的选择过程中选择绩效指标时需要谨慎。然而,根据与目标气候变量有直接或间接关系的所有可用绩效指标(本研究中的 PR、PSL、SAT 和变暖趋势)选择的子集可以合理地预测平均变化信号和相关的不确定性。所以,

在没有关于 GCM 之间相似性的信息的情况下应用代议制民主时需要谨慎。不同机构开发的 GCM 已经共享配方、代码和组件(Leduc 等人,引用2016年;桑德森等人。引用2015a)。KIOST-ESM 基于 GFDL 模型的大气和海洋组成部分(Kim 等人,引用2019)。NorESM2 和 CESM2 共享计算机代码基础设施和许多地球系统模型组件(Seland 等人,引用2020)。相反,两个较小的变体 MIROC6 和 MIROC-ES2L 比具有相同大气成分的 HadGEM3-GC31-LL 和 ACCESS-CM2 彼此更加独立(Mackallah 等人,引用2022)(如图。4b). 因此,研究人员对 GCM 配置的专业知识可能有助于在主观选择过程中识别次要变异组。

这项研究采用了两个全球规模的再分析数据集来证明模型性能和选择结果在空间尺度上的差异,从全球到加拿大次区域级别(无花果。1–3和如图。6)。然而,基于网格观测数据集(例如 ANUSPLIN;Hutchinson 等人,引用2009)和其他可用的再分析数据集(例如北美区域再分析;Mesinger 等人,引用2006)加拿大及其次区域。虽然本研究中提出的框架是为模型选择而设计的,但它可以轻松扩展以考虑基于性能的 GCM 加权(即根据历史模拟中的模型性能为未来预测分配不同的权重),因为本研究中定义的性能度量是类似于加权方法中使用的预测变量(例如 Brunner 等人,引用2020b)。还需要继续研究在世界不同地区调查基于绩效的 GCM 选择,特别是观测限制对区域 SAT 变暖趋势的重要性,例如基于 IPCC 气候参考区域对气候模型数据进行次大陆分析(Iturbide)等人,引用2020)。

发布日期:2024-01-26