树人论文网一个专业的学术咨询网站!!!
树人论文网

基于异质边图注意力网络的电力系统振荡评估模型

来源: 树人论文网发表时间:2022-01-17
简要:摘要:新能源发电使电网潮流更加快速的变化。跟踪潮流变化,在线预测电网关键振荡模式的阻尼比和机组参与因子对维护电网运行安全有重要意义。本文采用数据驱动的建模思路,设计了基

  摘要:新能源发电使电网潮流更加快速的变化。跟踪潮流变化,在线预测电网关键振荡模式的阻尼比和机组参与因子对维护电网运行安全有重要意义。本文采用数据驱动的建模思路,设计了基于多任务学习和深度学习框架的电力系统小干扰稳定评估模型(Small-Signal Stability Assessment, SSA),可同时实现多振荡模式的阻尼比预测和机组参与因子预测任务。基于图注意力网络和异质图思想,设计了引入边信息的边图注意力机制和将节点和边分类处理的异质图处理方法,建立了能有效利用边信息的异质边图注意力网络模型 (Heterogeneous Edge Graph Attention Network, HEGAT)。以 HEGAT 的特征聚合为基础,通过多任务共享参数和基于联合误差函数的训练提高了特征提取能力。IEEE10 机 39 节点算例的对比实验表明,HEGAT-SSA 能快速准确的预测模式和模态变化,并具有对拓扑变化的良好适应能力。

  关键词:小干扰稳定评估;图深度学习;边注意力;异质图;多任务学习

基于异质边图注意力网络的电力系统振荡评估模型

  朱思婷; 管霖; 郭梦轩; 黄济宇; 陈鎏凯; 钟智 电网技术 2022-01-17

  0 引言

  随着电网规模不断扩大、高渗透率可再生能源并网和超远距离交直流系统互联,弱阻尼诱发的电网振荡问题已成为威胁电网安全稳定运行的重要因素之一[1]。调整机组出力和电网运行方式是抑制振荡的主要措施[2,3]。若能跟随电网潮流的变化,快速预测关键振荡模式的阻尼比变化和主要机组对振荡模式的参与因子,就能辅助调度员制定预防控制策略,调整机组出力,防范振荡的发生。当前电网振荡的分析方法均建立在基于物理机理的详细数学模型基础上,主要包括基于平衡点线性化模型的特征分析方法和基于非线性系统受扰时域仿真结果的辨识分析方法。其中,代表性的特征分析方法有降阶选择法、序贯法和子空间法 [4,5]。随着变流器等具有切换控制特点的新设备涌入,以及电力系统规模的不断扩大,特征分析方法在建模和计算耗时等方面面临越来越大的挑战。辨识类方法利用扰动下的时域仿真或观测到的状态量时变曲线,采用 Prony[6]分析等辨识方法提取系统振荡模式信息,具有更强的模型适应能力。但是,扰动往往会激发多种振荡模式且在不同节点和支路观测到的模式信息也是变化的。目前辨识类方法在分析振荡模态信息,例如主要机组对振荡模式的参与因子方面还缺乏成熟的技术方法。

  基于数据驱动的稳定评估方法为大规模电力系统中跟踪潮流变化进行快速振荡分析提供了一种新的技术路线[7]。根据样本获取方式和来源的不同,数据驱动的小干扰稳定评估模型输入信息和建模难度也有显著差别。

  一类研究借鉴辨识的思路,以扰动下运行变量的时间序列作为输入,预测振荡模式信息(振荡频率和阻尼)。其建模关键在于时序信息的特征处理 [8-10]。学者们采用的输入信息包括扰动过程中的母线电压幅值和相角、节点注入功率等时间序列,采用 了 多 层 深 度 置 信 网 络 [8] , 卷 积 神 经 网 络 (Convolutional Neural Network, CNN)[9],长短期记忆网络(Long Short-Term Memory,LSTM)[9,10]和图卷积网络(Graph Convolutional Network, GCN)[10]等深度学习模型实现特征聚合。但由于难以有效处理电网不同节点振荡曲线的空间相关性,尚未见文献实现对振荡模态信息的识别。

  另一类研究借鉴特征分析方法,采用电网稳态运行信息作为输入进行振荡模式辨识[11-13],无需依赖扰动下的振荡曲线作为模型输入。这类数据驱动模型遇到的挑战是,大电网中厂站和线路众多,描述运行方式信息的输入空间维度高,需要考虑拓扑结构等离散信息,输入与待评估的振荡模式/模态等输出特征之间的关联关系更加复杂。这些都对预测模型的特征聚合和关联关系挖掘能力提出了诸多挑战。相关建模方法的研究刚刚起步,但已经取得许多有价值的成果。文献[11]将发电机有功出力、有功负荷、线路有功功率分别输入三组不共用参数的卷积神经网络(CNN)进行特征聚合,输出特征拼接后作为全连接层的输入进行阻尼比预测。文献[12] 按节点关联矩阵的方式将输入信息组织成类似图像数据的结构输入 CNN 模型。其思路是将节点功率作为输入矩阵的对角元,将支路有功、无功功率作为输入矩阵的非对角线元。两节点之间无线路连接时对应元素为 0。这种输入信息组织方式可以充分发挥卷积网络的特征提取能力。制约因素是它要求组成节点特征和支路特征的物理量是相同的。文献[13]则在图卷积网络(GCN)中引入了边卷积机制构建了边图卷积网络模型,实现节点信息和边信息的聚合,可以同时预测多模式的振荡频率和阻尼比,且对拓扑变化具有一定的适应能力。

  以上研究成果均仅预测了关键振荡模式(频率和阻尼比),未考虑相应振荡模态信息的预测(例如主要机组对振荡模式的参与因子)。其中一个技术障碍是 CNN、GCN 等深度学习模型在特征聚合时未区分发电机与负荷功率,因而聚合后的新特征难以准确反映机组对振荡模式的参与程度。图注意力网络(Graph Attention Network, GAT) [14]采用注意力机制而非卷积操作来实现图结构中节点对其邻域信息的聚合,相较于 GCN 具有更强的可解释性和差异化提取邻居信息的能力。进一步地,异质图思想[15]为区分节点和边的类型,进行分类聚合提供了一种可行方案。借鉴并集成异质图思想、图注意力机制和边卷积机制,本文提出了一种异质边图注意力网络(Heterogeneous Edge Graph Attention Network, HEGAT)模型结构,并以 HEGAT 为核心设计了基于稳态运行信息的多任务小干扰稳定评估模型,简称 HEGAT-SSA。

  论文的主要贡献如下:

  (1)改进图注意力机制,构建了能融合节点信息和边信息的边图注意力模型。(2)引入异质图设计,将网络图划分为电源图和传输图,差异化地分类聚合节点的邻域特征。(3)建立了多任务学习框架,可同时实现多个关键振荡模式的阻尼比预测和机组参与因子预测任务。(4)通过算例和对比实验验证了 HEGAT-SSA 模型的预测准确性和快速性,和对线路开断等电网拓扑变化的良好适应能力。

  1 基于稳态信息和数据驱动的电力系统小干扰稳定评估模型设计思路 1.1 小干扰稳定的特征分析模型简介

  基于物理机理描述的电力系统数学模型属于高维的非线性微分代数方程组,可用式(1)描述[16]: ( , ) 0 ( , ) f g x x y x y (1) 其中,向量 x 为系统的状态变量;向量 y 为系统的代数变量; f ( , ) x y , g( , ) x y 均为高维非线性函数。特征分析方法建立在线性系统基础上,因此需要在系统平衡点 0 0 ( , ) x y 处对上述模型进行线性化处理: 0 0 0 0 0 0 0 0 , , , , ( , ) ( , ) , 0 ( , ) ( , ) , f f g g   x x y y x x y y x x y y x x y y x y x y x x x y x y x y y x y (2) 消去代数变量y ,可得:  x A x = (3) 式中,A 为系统的状态矩阵。通过特征分析法可求解 A 的特征根 λ 为: 1 2 [ , ,..., ] = n λ    (4) 小干扰稳定中,将共轭复根 i i i      j 称为系统的振荡模式。振荡模式 i 的阻尼比定义为: 2 2 - = + i i i i   (5) 由李雅普诺夫判据可知,仅当阻尼比为正时系统小干扰稳定,且阻尼比越大,系统抗扰能力越强。阻尼比是系统小干扰稳定分析中的重要指标。

  根据矩阵特征根理论,i 对应的特征向量称为振荡模态,满足: i i i i i i λ λ v A v Au u (6) 其中 i v 、 ui 分别称为 i λ 的左右特征向量。机组参与因子幅值 ki, p 定义式如下: , , , T | | max(| |) k i i k k i i i u v p  v u (7) 其中 ik, v 、 ki, u 乘积的幅值度量了第 k 个状态变量对第 i 个模式的参与程度。 T max(| |) i i v u 表示左右特征向量对应元素之积的幅值的最大值。 ki, p 是一个反应可观性和可控性的综合指标,可为相应控制对策提供重要信息。

  1.2 数据驱动的 SSA 建模思路和 HEGAT-SSA 建模流程

  从数学分析的角度看,小干扰稳定分析问题是以电力系统结构、发电和负荷功率、设备参数为输入变量,以小干扰振荡模式和模态为输出变量的确定性分析问题。对于这个问题,1.1 节基于物理原理的建模分析方法采用线性微分方程组模型和特征根分析技术。而数据驱动建模分析则采用另一种思路,它应用历史观测和分析中获得的大量输入输出样本集,建立固定结构的非线性代数模型,通过学习模型参数来实现从输入到输出的映射。深度学习是其中处理复杂高维输入信息能力最强的模型之一。对一个实际电网,设备一旦投运,其参数基本不再变化。因此基于深度学习模型的小干扰稳定分析输入中只需要包含电网拓扑结构和潮流分布两类可变信息,即式(1)中 x 和 y 的初始值。尽管如此,对于大电网,描述稳态运行方式的输入量维数仍然非常高,而且深度学习模型需要实现离散的拓扑结构信息与连续的运行信息的聚合。同时,基于物理机理,我们还知道小干扰振荡的阻尼水平与线路重载密切相关[17],因此为了提高深度学习模型的稳定评估性能,除节点功率外,深度学习模型最好能有效发掘支路功率对振荡模式的影响。此外,在节点注入功率中,发电机功率变化对振荡模式的影响也远比负荷功率变化重要。综合以上所有对建模的需求,本文借鉴 GAT 模型,提出了一种新的深度学习模型:异质边图注意力网络模型(HEGAT),并以之为核心设计了多任务小干扰稳定评估模型(简称 HEGAT-SSA)。它不仅能够进行快速振荡分析,还能够给出当前运行方式与模式、模态之间的灵敏度关系,为调度在线决策提供更多信息。

  HEGAT-SSA 的建模分为样本生成、离线训练和在线运用三个阶段。完成训练的模型投入运行后,可以快速根据输入的稳态运行方式给出关键振荡模式的阻尼比i 和机组参与因子幅值 ki, p ,为在线调度决策提供信息。流程图如图 1 所示。

  1.3 样本生成中关键振荡模式的筛选与匹配

  样本标签的获得是数据驱动建模研究中必须面对和解决的问题。由于本文希望同时预测阻尼比和机组参与因子,目前基于 WAMS 观测量的辨识技术还难以提供全部信息,因此采用特征分析方法生成样本标签。实际电网机组数量庞大,振荡模式众多。每个运行方式下,同一个模式的特征值和特征向量都在不断变化。如何不依赖人工判断,完成不同运行方式下的众多特征根和特征向量按模式进行正确匹配和分组,是数据驱动的 SSA 建模需要解决的问题之一。对此,本文设计了图 2 所示的振荡模式匹配算法:首先,对每个运行方式进行特征分析,并按机电回路相关比大于 1 对特征根进行初步筛选。继而根据模式阻尼比i确定一部分弱阻尼振荡模式作为模型预测的关键振荡模式。这个环节还可以借助调度运行经验辅助筛选。

  匹配算法思路是先筛选少量运行方式构成中心样本集。中心样本集中的每个样本都已确定了关键振荡模式和对应的模态(特征向量)。对众多待筛选的运行方式样本,以中心样本的振荡模态为参照系,以模态相似度为评价函数实现关键振荡模式的匹配和选择。具体做法如下:

  (1)预筛选得到中心样本集。

  随机选择一批样本,并按机电回路相关比对模式进行初步筛选。对每一个样本和通过筛选的所有模式,按下式计算该样本的模式平均参与因子和: , ( ) c n k i i=1 k p score = c   1 (8) 其中,n 为该系统中的机组台数,c 为关键振荡模式数, ki, p 为 i 模式下机组 k 的参与因子幅值。

  选择 score 较小的样本构成中心样本集。对于实际电网,还可以结合专家经验选取那些关键振荡模式可以明确判断出来的运行方式构成中心样本。

  (2)对每个待筛选的样本,计算它的每个模式与中心样本关键模式的相似度。

  本文选定机组参与因子的幅值序列和右特征向量的相角序列作为构建相似度的变量。其中参与因子幅值体现了单个机组对单个振荡模式的参与程度。一个振荡模式下两机组的右特征向量相角差展示了两机组的振荡方向,即分为两群相互振荡还是同属一群与其他机组振荡。相似度定义如下: , , , , 1 , , ((1 ) min( ) ˆ ˆ ( ) (0.5cos( ) 0.5)) ˆ n k x k y k x k y k= k x k y - p - p p , p s x, y = α - α +  (9) 式中,x 是待筛选的样本中的一个模式,y 是中心样本中的一个模式。k,x 是振荡模式 x 下机组 k 的相对右特征向量相角。它是模式 x 下参与因子最大的机组右特征向量相角为参考系的相对值。 kx, p 为机组参与因子幅值。n 为机组台数。

  (3)基于 KM 算法的样本模式分类。

  对于一个模式待筛选的样本,经过与中心样本的相似度计算后,可以得到相似度矩阵 c c  SR , c为模式待筛选的样本中的模式数。模式分类是在已知相似度矩阵的情况下,从模式待筛选样本中选择不重复的模式与中心样本中的每一个关键振荡模式对应,使得配对结果的模式相似度和最大。当 c c 时,它可以抽象为求解二分图内完备匹配下的最大权匹配问题,本文选用 KM(Kuhn-Munkras)算法进行求解。当 c c  时,相当于二分图两侧的节点个数不同,此时可以在相似度矩阵中添加全 0 行,即在二分图节点较少的一侧添加点和权为 0 的边,将此问题转化为完备匹配情形,其求解方法与 c c 情况一致。

  (4)对中心样本集中的每一个中心样本执行步骤(2)和(3)。统计每个模式的分类情况,选择频数最高的模式分类结果组成最终分类结果。以上振荡模式筛选和匹配过程由软件自动实现,并按振荡模式分组分别记录特征分析法得出的样本标签:所有机组的参与因子向量 pi 和模式阻尼比i,并与对应的运行方式信息组成训练样本。需要特别指出的是,以上样本生成工作在建模阶段由计算机程序自动完成,无需人工干预,不影响在线阶段的 SSA 分析速度。

  2 基于异质图思想的边图注意力网络模型

  电力网络可以描述为图 g N E D  ( , , ) ,其中 N 表示系统中所有母线(节点)的集合,E 表示系统中所有输电通道(边)的集合,D 为描述节点之间连接关系的邻接矩阵,其中的元素 di,j一般形式如式(10) 所示: , 0 ( , ) 1 ( , ) i j i j i j N N d N N       E E (10) 其中 Ni 表示节点 i,( ) , N Ni j 表示节点 i 与节点 j 之间的边 ij e 。

  从物理概念分析,当电力系统中主要动态元件及其控制模型一定时,电网振荡模式及其阻尼比大小,乃至各机组对某个振荡模式的参与程度等均可以由电网拓扑和功率分布完全确定。当根据稳态运行信息进行小干扰稳定评估时,对一个指定的振荡模式来说,除发电机功率之外,部分关键通道(线路) 的传输功率大小同样是影响振荡阻尼性能的重要判别条件。据此,本文设计的 HEGAT-SSA 模型输入信息不仅包括描述网络拓扑的邻接矩阵,还同时包含了节点和支路的稳态运行信息,如表 1 所示。

  其中,节点特征描述为如下矩阵形式: T H h h h = , , , 1 2 m [ ... ] (11) i i i i i i i i = U , L L G G h ( ) θ , P ,Q , P ,Q ,T (12) 式中,H 为节点特征矩阵,由 m 个节点特征向量构成, m b H R ,b 是节点特征个数。hi 为节点 i 的节点特征向量, U ,i i i i i i L L G G θ , P ,Q , P ,Q ,T 等变量含义,见表 1。

  边特征矩阵 r 通过对邻接矩阵扩展来构造,r 中的元素 rij , 表示为以下形式:

  r E (13) 式中, mme   r R ,即矩阵 r 为 m×m 维,其中每个元素 ri,j 均为 e 维行向量,表示连接节点 i、j 的边的特征,e 为边特征个数。

  需要特别指出的是,本文模型允许自由地选择节点特征和边特征,对两者的维数没有限制。 SSA 模型设计的核心是如何通过大样本的有导师学习,实现对上述复杂输入信息的有效聚合,生成与预测输出(振荡模式和模态)具有强相关性的新特征。本文提出的异质边图注意力网络(HEGAT) 能较好地实现上述目标。

  图 3 为 HEGAT 的整体结构。它以异质图边注意层和多层边图注意力层的组合作为特征提取器。发电机特征与其它特征的聚合参数不同,为机组参与因子的预测创造了条件。加入残差连接实现梯度的跨层传播,以抑制训练中的梯度退化风险,为了避免参数冗余,残差环节共用全连接层(Fully Connected Layer, FC)进行降维。HEGAT 的输出特征将接入多层感知器(Multilayer Perceptron, MLP) 实现不同振荡模式(阻尼比i 和模态(机组参与因子幅值 ki, p )的预测。以下具体介绍 HEGAT 中边信息的聚合方法和异质图的设计。

  2.1 引入边信息的图注意力机制

  常规图注意力网络(GAT)引入注意力机制为节点与其邻接节点的信息聚合设置权重,从而对节点之间的相互联系进行差异化的处理,使得模型可以更好地关注到重要的节点信息[13]。但 GAT 的节点信息聚合方式中不能考虑丰富的边信息,仅能在邻接矩阵中以一个权系数描述边的强度。本文模型需要集成的输电线路首、末端有功功率、无功功率等信息则难以被利用。对此,本文设计了新的边图注意力模型(EGAT)。若将信息处理过程划分为注意力计算和邻域表征汇聚两个阶段,则第一个阶段 EGAT 的处理方式与 GAT 相同,在表征汇聚阶段 EGAT 引入了边信息。具体说明如下:

  (1)注意力计算

  本文在注意力计算阶段采用多头注意力机制增强模型的性能。多头注意力机制是 GAT 中常用的一种性能提升方法。它是指在学习权矩阵 W 和时通过随机初始化和误差反向传播训练出多组不同的权矩阵,每组权矩阵称为一个注意力头 p。若注意力头的总数为 P,意味着实际生成了 P 组不同的模型参数。在应用时,每一层均对所有注意力头的输出特征进行聚合,实践表明这种机制有助于增强模型的学习能力。采用经典 GAT 模型的思路,根据目标节点和邻域节点的信息计算注意力值,公式如下: , exp(LeakyReLU( ( || ))) exp(LeakyReLU( ( || )) u p u p v p uv p p u p q p q hW hW hW hW  (14) 式中uv p, 为注意力头 p 下节点 u 对节点 v 的注意力系数。节点 v 为节点 u 的邻域节点(即 , 0 v u d  )。 u q表示节点 q 是节点 u 邻域内的任一节点。 exp( ) / exp( ) u q是常用的 softmax 归一化操作,  || 是对节点 u、v 的特征变换进行拼接处理。 b b p W R  是可学习的权矩阵,能实现 b 维特征至 b'维的特征变换,p 是可学习的权重向量。需要指出的是,EGAT 中同一层的所有节点共享相同的权矩阵 Wp 和p 。LeakyReLU 是深度学习中较为常用的非线性激活函数,其表达式如下: Leaky Re LU( ) , x x x ax x      0 0 (15) 其中常量 a 一般取为 0.01。

  (2)邻域表征汇聚

  在本文提出的 EGAT 模型中,汇聚含有 P 个注意力头的邻域表征时不仅考虑邻域节点信息,也增加了对连接邻域节点的支路信息的集成。公式如下: 1,..., , , || ( ( || )) u u p P uv p v p v u p v N  h h W r Q     (16) 其中为非线性激活函数, e e p   Q R 实现 e 维边特征至 e维的特征变换。可以看出,邻域节点和支路信息均采用式(14)获得的注意力系数计算邻域特征的加权和,然后拼接所有注意力头得到的节点特征,实现特征集成。 图 4 对比了 EGAT 与 GAT 的差别。EGAT 在特征聚合过程中同时加入了邻域节点和对应边的嵌入特征,提升了模型对边信息的利用能力。

  2.2 异质图边注意层设计

  物理机理上,功角稳定问题中同步发电机节点的影响远远高于负荷节点或联络节点。传统 GAT 在信息处理中未区分节点类型。本文在上节的 EGAT 模型基础上进一步增加了异质图的设计,形成异质边图注意力模型(HEGAT)。HEGAT 将电网节点划分为发电机节点 G 和传输节点 P 两类,相应的支路(边)也分为 G-P 边和 P-P 边两类。

  采用节点分裂法分裂发电厂高压母线节点,形成不同的子图,如图 5 所示。含有电源节点的子图称为电源图,它仅包含 G-P 边。不含电源节点的连通图称为传输图,它只包含 P-P 边。上述图分割过程可以通过对邻接矩阵 D 进行变换实现。首先将邻接矩阵 D 中表征发电机节点 G 与其他传输节点连接关系的元素置为 0,可得到传输图对应的邻接矩阵 DP,其中元素 di,j 如式(17)所示: , 1 ( , ) & ( , ) 0 i j i j i j N N N N d          E G 其他 (17) 同理,将邻接矩阵 D 中不在发电机节点行/列上的非零元素均置为 0,可得表征电源图的邻接矩阵 DG。其中的元素 di,j如式(18)所示: , 1 ( , ) & ( ) 0 i j i j i j N N N or N d           E G G 其他 (18)HEGAT 由2 个EGAT网络组成(称为 HEGAT-G 和 HEGAT-P),如图 6 所示。其中 HEGAT-G 的输入邻接矩阵为 DG,HEGAT-P 的输入邻接矩阵为 DP。两个网络的节点输出特征维数可以独立设置,记为 bG'和 bP'。相应的,HEGAT-G 中仅发电机节点与连接它的分裂节点之间进行了考虑注意力的特征聚合,而 HEGAT-P 中除发电机节点之外的所有节点之间进行了邻域特征聚合。

  HEGAT-G 和 HEGAT-P 的参数分别训练,即 HEGAT 模型区分节点和边的类型,分别采取了不同的特征聚合方案。需要指出的是,尽管 DP 实际包含多个互不连通的图,但鉴于 EGAT 图中的权矩阵 W 是面向节点的,HEGAT-G 中的所有节点仍共享相同的变换参数。 HEGAT-G 和 HEGAT-P 分别完成对发电机节点和传输节点的特征聚合后,矩阵进行拼接,即可得到经由 HEGAT 层处理后的节点嵌入特征矩阵 G P m b b   ( )   HR ,拼接过程可由式(19)表征。 G P H H H  || (19)

  2.3 多任务学习框架的设计

  多任务学习(Multi-task Learning, MTL)是将多个任务的损失函数统合在一起进行反向传播并更新学习参数的框架。当这些任务之间存在内在关联性且存在共享的参数时,MTL 框架能够取得比单独训练更好的学习效果。如图 3 所示,本文采用了 MTL 框架,HEGAT 完成特征提取之后,其输出特征分别输入不同的多层感知器 MLP 网络执行不同的预测任务。每一个 MLP 对应一个关键振荡模式,并同时预测阻尼比与机组参与向量 i p 。MLP 中的激活函数均选用 PReLU[18]。PReLU 为 ReLU 的改进,其表达式如下: P Re LU( ) , x x x ax x      0 0 (20) 其中 a 为可学习的参数。该激活函数可以自适应地学习矫正线性单元的参数,有助于提高准确率。

  学习采用的损失函数由两部分组成。一项是阻尼比预测对应的损失函数:loss b N        1 1  1 (21) 式中,b 为一个批次训练的样本个数,N 为单个样本中的关键模式总数; h i 为样本 h 下第 i 个关键模式的阻尼比预测结果, h i 为样本 h 的对应阻尼比标签值。另一项是机组参与因子对应的损失函数: TP + FN b N n h h k i k i h i k p p p loss     , , 1 1 1 (22) 式中,n 为发电机节点数; h k i p  , 为样本 h 下第 i 个关键模式中第 k 台发电机组参与因子幅值预测结果, h k i p , 为相应的参与因子标签值。TP+FN 为一个批次训练样本中,参与因子标签大于 0.1 的机组总数。总损失函数为以上两项损失函数的加权和: p loss w loss w loss   0 1  (23) 式中,两类预测任务的权重 w0 和 w1可根据训练情况和实际需来设定。本文中取 w0 为 4,w1为 6。

  3 算例分析

  算例分析采用新英格兰 10 机 39 节点系统。提出的 HEGAT 模型在 Pytorch-Geometric 框架下实现,在训练过程中采用余弦退火算法对学习率进行有序调整,初始学习率取使初始损失下降最快的数值。计算平台配置为:Intel Core i9-7900X 3.30GHz CPU、128GB RAM 和 NVIDIA GeForce GTX 1080 Ti。

  3.1 样本集构造

  采用中国电科院仿真软件 PSD-BPA 生成训练样本集和测试样本集。为检验模型对电网拓扑变化的适应能力,生成了全拓扑和随机开断一条或两条线形成的“N-1”和“N-2”拓扑形式。对每种运行拓扑,以 5%步长在 75~120%之间改变负荷水平,等比例同步改变各机组的发电功率保证潮流平衡。继而,在电压约束和容量约束允许范围内,对发电机出力附加 5%以内的随机波动,对 PV 节点的电压附加 1%以内的随机波动。去除形成孤岛以及潮流不收敛的方式,共获得 8333 个运行方式样本。按拓扑联通情况划分为四类样本集:全拓扑(样本集 A)、N-1 拓扑(样本集 B)、N-2 拓扑(样本集 C)、在样本集 A 中随机抽取一定数量的样本加入样本集 B(样本集 D)。样本集 A、B、C、D 的总数分别为 1859、5250、 1224、5413。

  基于上述样本集构建了三类试验方案。具体如下:

  (1)试验方案一:仅利用样本集 A。按照 5:1 的比例将 A 中的样本随机划分到训练集和测试集。该试验中电网拓扑没有变化。(2)试验方案二:仅利用样本集 D。按照 4:1 的比例将 D 中的样本随机划分到训练集和测试集。该试验中电网拓扑有变化,但训练集和测试集中均含有全拓扑和“N-1”拓扑下的样本。(3)试验方案三:以样本集 B 作为训练集,样本集 C 作为测试集。试验中不仅电网拓扑有变化,而且训练集样本和测试集样本对应的拓扑不同。

  3.2 振荡模式的筛选和匹配结果

  经由振荡模式筛选和匹配后,8333 个样本被重新组织。图 7 展示了随机选取的 50 个样本的分类结果中的四个模式。其中一张子图代表一种振荡模式的分类结果,子图中的一个相量代表一个样本中的一台机组,其幅值为参与因子幅值,相角为右特征向量相角。不同机组用不同颜色标识,参与因子小于 0.1 的机组不在图中展示。图 a)至图 d)分别选定 G2、G10、G4、G7 作为参考系展示了模式 1 至模式 4 的振荡情况。模式 1 中,G2、G3、G5 分作一群相对于 G6、G7 振荡。模式 2 中,参考机组 G10 相对于其他机组振荡。模式 3 中,主要参与振荡的机组为 G4,G6、G7、G5 与 G4 相对振荡。模式 4 中,主要参与振荡的机组为 G7,G4、G6 与 G7 相对振荡。值得注意的是,随着运行方式的变化,同模式的机组相对振荡情况也会发生变化。

  tSNE[19]可以将高维数据降维到二维空间,为展示高维特征提取的效果提供了一种解决方案。为便于展示,我们针对某一关键振荡模式进行分析,取阻尼比 0.03 和 0.045 作为区分失稳与临界稳定、临界稳定与稳定的阈值,将样本用不同颜色标注为有失稳风险、临界稳定和稳定,得到原始输入特征和经多层注意力提取后的样本分布,如图 8 所示。

  可以看出,对于该模式,三类样本在原始输入特征空间中没有明显的界限。经过特征聚合后,三类样本呈现出较为明显的聚集特征。这说明通过多次的注意力计算和邻域表征汇聚,由 HEGAT 与 EGAT 构成的特征提取模块,能够从输入的发电机节点有功出力、支路功率等信息中,挖掘并聚合出与模式强相关的新特征。

  3.3 模型性能评价指标

  对于阻尼比预测任务,本文选择平均百分比误差(MAPE)作为衡量模型性能的指标。 MAPE b N h h i i h h i i b N    1 1 1   (24) 对于机组参与因子预测任务,本文引入表 2 所示混淆矩阵用于构建分类问题指标。

  当机组参与因子幅值 p 大于 0.1 时,将此机组划分为参与振荡。当机组参与因子幅值 p 小于 0.1 时将此机组划分为不参与振荡。除了准确率 ACC、漏判率 MA、误判率 FA、三级指标 G-mean 等常用的分类指标外,本文还构建了 TPE 指标用于评估模型在预测参与因子幅值具体数值层面的表现。各项评估指标计算公式如下: TP + TN ACC TP + TN + FP + FN = (25) FP MA = TN + FP (26) FN FA = FN + TP (27) G - mean = (1- MA)(1- FA) (28)TPE TP j j j j p p  p    1 (29) 式中 pj 为一个批次训练样本中,第 j 个参与因子预测结果, pj 为其对应的真实值。ACC、G-mean 是评判模型性能的首要目标,而在机组参与因子预测任务中,在正确预测机组参与的基础上,精准预测参与因子的大小也是需求之一,因此 TPE 也是需要重点关注的指标。

  3.4 模型参数的设计原则

  数据驱动模型的参数包含了模型从样本中获得的全部知识,也决定了模型预测的效果。其中,深度学习模型结构相关的参数需要在设计阶段确定,也称为超参数。本文模型中超参数主要包括特征提取的层数和多头注意力的头数选择(EGAT 层数 L、EGAT 层注意力头数 P)。图神经网络模型的层数选择方面,面向全局特征提取的图神经网络层数一般缺省值为 3 层。太少则特征聚合范围太小,太大则面临特征退化问题。具体应用中可对比 3-5 层模型的训练效果选择最优层数。注意力头数 P 的取值范围为[1,8][13,20],同样可根据实际训练结果进行比选。

  我们采用试验方案一并固定其他结构不变来确定 EGAT 层的模型超参数,实验结果如图 9 所示。

  由图 9a)可知,仅在 HEGAT 层后添加一层 EGAT,效果较差。随着更多的 EGAT 层的加入,节点输出特征的感受野扩展,MAPE 有所下降,同时 TPE、MA、FA 也有明显的改善。当取到 L=3 时,模型达到一个较优的表现。当 L 继续增加,模型性能有所下降。根据图 9b),调整 EGAT 层注意力头数 P 的 MAPE 和 ACC 的性能变化在 0.1%和 0.62% 以内。P 的最优取值为 4。我们经对比寻优确定了模型所有参数,如表 3 所示。其中,多个 MLP 结构相同,仅以 MLP-1 为代表给出。表中符号说明如下:“7-3/35/8”表示该层输入向量为 7 维节点特征和 3 维边特征,单注意力头输出为 35 维节点嵌入特征,共 8 个注意力头。的“356-3/19/4”表示输入为 356 维嵌入节点特征和 3 维边特征,单注意力头输出为 19 维节点嵌入特征,共 4 个注意力头。MLP(FC-1)对应的“1092/128”表示输入为 1092 维特征,输出为 128 维。残差 FC 表示图 3 中残差连接上的 FC 网络,“7/3”表示其输入为 7 维节点特征,输出为 3 维。

  3.5 不同拓扑变化下模型性能测试

  本节比较 HEGAT 模型与常规深度学习模型的性能,我们构建了以 CNN 神经网络为核心的对照组模型。CNN 模型结构为 3 个卷积层、3 个池化层,末端预测器 FC 层数为 4,与 HEGAT 保持一致。 CNN 模型采用参考文献[12]的输入构成方式,以分任务预测的方式分别输出阻尼比与机组参与因子。在三个试验方案下分别训练 HEGAT-SSA 模型以及对照组模型。它们在测试集上的表现如表 4 至表 6 所示。图 10 采用可视化的方式显示了不同模型不同试验中的性能指标。

  三组试验中,HEGAT-SSA 对阻尼比和机组参与因子的预测性能均显著优于对照模型。当网络拓扑没有变化时(试验一),各模型在测试中的性能均优于网络拓扑有变化的场景。但是,即使存在电网拓扑变化,只要训练样本集中包含了一定数量的不同电网拓扑样本,HEGAT 就能在测试集中表现出很高的预测准确性。当测试样本对应的电网拓扑结构在训练样本中没有出现过时,本文模型的预测性能也略有下降,但是阻尼比预测 MAPE 仍低于 5%,机组参与因子的预测 ACC 高于 93%,远远优于对照组模型。三组试验表明 HEGAT-SSA 模型对电网拓扑变化具有一定的适应能力。同时,在模型的训练样本构成中尽可能包含一些不同拓扑下的样本有助于改善模型对电网拓扑变化的适应能力。

  3.6 异质图与边图注意力机制改进的性能测试

  为了验证本文提出的异质图设计与边图注意力设计的有效性,本节分别采用常规图注意力层 (GAT)、2.1 节所提的边图注意力层(EGAT)替代 2.2 节的 HEGAT 层,并保持模型设计中的其它环节,包括残差连接、特征提取层数和多任务 MLP 等结构和设计不变,分别形成不同的 SSA 模型,并在三个试验方案下进行性能对比。HEGAT 模型与 EGAT 和 GAT 模型的性能表现如表 7 至表 9。图 11 可视化展示了注意力机制改进在不同试验中的性能指标。

  以上对比可以清晰的看出从 GAT → EGAT→ HEGAT 带来的性能上稳定的递进改善。

  3.7 多任务预测的性能对比

  为了验证多任务框架的有效性,我们设计了分任务的对照案例,即分别生成一个多模式阻尼比预测模型,和一个多模式机组参与因子预测模型。这两个模型的其它各环节结构均与推荐的多任务 HEGAT-SSA 模型相同,仅仅最后的预测器环节中各 MLP 预测器分别仅仅预测阻尼比或者仅仅预测机组参与因子。这个对照案例称为分任务设计。它与推荐多任务设计在三个试验下的性能表现如表 10 至表 12 所示。

  从表 9 至表 11 的结果可知,同时预测阻尼和参与因子的多任务模型效果明显优于分任务预测的效果。且当样本集中包含拓扑变化时,其性能上的优势越明显。这表明同时预测两个存在关联的任务可以在学习过程中增强特征提取环节的训练性能。

  3.8 验证模型设计参数迁移性的实验

  我们在 IEEE39 系统的基础上,删除了 5 号、7 号、8 号机组及其相连的三条母线,得到了 36 节点 7 机系统。按照 3.1 节所提方法,生成全拓扑运行方式样本共 1845 个。划分其中 300 个作为测试集,其余样本作为训练集,训练集和测试集样本比例约为 5:1。模型参数设计同表 3,仅对 FC4 层和 FC1 层进行修改,以适应样本节点数和机组数的变化。在新样本集下,重新训练模型,实验结果如下表所示:

  根据表 13 可知,3.4 节所提模型参数设计具有一定迁移性和拓展性。

  3.9 与特征分析法的评估时间对比

  本节对比了 HEGAT 模型相对于传统特征分析方法的计算速度优势。对照算法使用 PSD-BPA 平台提供的 QR 算法。在三个试验方案下训练 HEGAT-SSA 模型,测试 HEGAT-SSA 以及对照组方法在测试集上的计算耗时。它们在测试集上的表现如表 14 所示。根据表 14 可知,HEGAT 的计算速度相较于传统方法 QR 法提升了三个数量级。

  4 结论

  本文提出的异质边图注意力网络模型在电力系统小干扰稳定评估中表现出良好的性能,可以同时实现振荡模式与振荡模态指标的预测。通过将网络图划分为电源图和传输图,采用不同的注意力参数,并有效聚合母线特征和线路特征,可以在线路负载率影响较大的评估问题中表现出优越的性能。采用多任务学习框架,同时进行多模式阻尼比预测任务和多模式机组参与因子预测任务并共享特征提取信息,相较于对照组模型 MAPE 最多提升了近 6%、ACC 最高提升了 6.5%。所提出的 HEGAT-SSA 模型预测信息丰富,对拓扑变化具有一定的适应能力,即使在 N-2 的情况下,MAPE 依旧在 5%以内、ACC 高于 93%。在实时安全稳定评估和调度决策中有良好的应用潜力。后续研究应关注模型的持续学习和增量学习技术,以提高模型在实际应用中可用性,降低对初始训练样本的完备性要求。