作者简介:董宏丽,女,1977年生,教授,博士研究生导师;主要从事先进控制理论技术、人工智能技术、优化算法等在油田领域的教学与研究工作。地址:(163318)黑龙江省大庆市东北石油大学。ORCID:0000-0001-8531-6757。
E-mail:shiningdhl@vip126.com
E-mail:wangchuang64@126.com
基于门控注意网络模型的天然气管道泄漏检测新方法
杨 帆1,2,3 商 柔1,2,3
1. 东北石油大学三亚海洋油气研究院
2. 东北石油大学人工智能能源研究院
3. 黑龙江省网络化与智能控制重点实验室
关键词:天然气管道;泄漏检测;麻雀搜索算法;门控循环单元;异常注意力机制;自适应优化;智能
0 引言
随着科学技术的不断进步,油气工业也在飞速发展。天然气作为一种高效清洁的能源,在工业领域得到了广泛应用,并在人们的日常生活中扮演着关键的角色。因此,天然气的运输问题尤为重要。管道运输以其平稳、投资少、运输量大、安全可靠等优点成为运输天然气最常用的方式[1]。截至2023年底,中国天然气管道的总里程已达11.8×104 km[2]。然而,管道不可避免地会受到自然腐蚀、工作环境和人为破坏等因素的影响,进而导致发生泄漏,严重危及环境、经济甚至人身安全[3]。因此,对天然气管道进行泄漏检测具有实际意义。
近年来,随着智能仪表的广泛使用,大量管道数据得以采集并记录[4]。因此,基于统计知识的机器学习方法在天然气管道的泄漏检测领域得到了广泛的应用。Liu等[5]利用贝叶斯网络构建管道泄漏检测模型,并通过先验概率和后验概率对泄漏进行预测。王明达等[6]将支持向量机和贝叶斯算法相结合来检测天然气管道燃气轮机的故障,以改善模型的检测性能。然而,机器学习检测模型往往基于浅层网络结构而建立,导致训练中提取的浅层特征难以充分表征高维数据的分布,限制了模型对复杂故障的识别能力[7]。
考虑到上述问题,基于神经网络的深度学习方法在故障诊断中得到了广泛应用,它能借助少量的专家知识和经验来处理大量数据,从而获得高度准确的检测结果[8-9]。吴定会等[10]利用深度自编码器对数据特征进行训练,并利用Softmax函数实现轴承故障的分类。Ning等[11]利用频谱增强技术来增强泄漏信号,并利用卷积神经网络(Convolutional Neural Network, CNN)自动提取泄漏特征,以此实现管道泄漏检测。然而,上述模型的结构中每层之间的节点是分离的,无法充分利用时间信息。因此,在处理大数据样本时,这些模型的性能较差[12]。
基于以上原因,循环神经网络(Recurrent Neural Network, RNN)在处理时间序列问题上展现出了显著的优势。RNN能利用过去和当前时刻的状态进行训练,不仅能提高模型的性能,还能加快收敛速度并提高模型稳定性。然而,近距离梯度的主导作用导致RNN在处理长时序列时受到梯度消失和梯度爆炸 的影响,使其难以捕捉和利用序列中的早期信息[13]。在这种情况下,学者们提出了一种RNN的变体——门控循环单元(Gate Recurrent Unit, GRU)[14],通过两种门控结构实现对信息的选择性记忆,进而提高模型性能。因此,GRU广泛应用于设备故障检测领域。周奇才等[15]将GRU和RNN结合来检测轴承故障,有效地解决了时间通道上的梯度消失问题。张龙等[16]利用GRU和 CNN分别提取信号的时间和空间特征,实现对齿轮箱的故障检测。然而,GRU的性能高度依赖于初始超参数的选择,不合适的参数会导致模型过拟合或陷入局部最优,进而降低模型的性能。因此,实现GRU超参数的自适应优化至关重要,这可以视作是一个优化问题[17]。
近年来,受到自然界动物行为模式的启发,许多优化算法得以发展,例如模拟退火算法[18]、蝗虫算法[19]、海鸥优化算法[20]、鲸鱼优化算法[21]、粒子群优化算法(Particle Swarm Optimization, PSO)[22-24]和麻雀搜索算法(Sparrow Search Algorithm, SSA)[25-26]等。这些算法的目标是在搜索空间内寻找待解问题的最优解。其中,SSA的设计灵感源于麻雀的觅食和反捕食行为,具有结构简单、收敛速度快、控制参数少及局部搜索能力强等优点,在解决优化问题领域受到了广泛应用。陈鑫等[27]应用SSA优化变分模态分解的分解层数与惩罚因子,从而更充分地提取泄漏信息,提高天然气管道泄漏检测的准确率。Xin等[28]应用SSA优化BP神经网络的初始权重和偏置,以实现油气管道内部泄漏的检测。
值得注意的是,在管道泄漏检测中,正常数据的主导作用使泄漏处不易被识别,导致检测模型的准确率较低。基于此,学者们提出了注意力机制(Attention Mechanism, AM)[29-30],通过赋予数据特征相应的注意力分数以增加正常和异常信号之间的差异,从而提高检测模型的准确率。张珂等[31]利用AM为CNN提取的故障特征分配不同的权值来突出故障信息,提高了在不同工况下轴承故障分类的准确性。Li等[32]将AM和长短时记忆网络相结合来检测滚动轴承的故障。
综上所述,本文提出一种基于SSA的门控注意网络(Sparrow Search Algorithm-based Gate Attention Network, SGAN)来提高天然气管道泄漏的检测精度。本文的主要贡献总结如下:
1)提出一种基于SSA的GRU模型。该模型将SSA算法无缝整合到检测模型中,从而使得模型初始超参数(迭代次数、学习率)的选择不再依赖于专家经验,有效地提高检测模型的性能。
2)提出一种异常注意力机制。该机制利用AM来定位与管道健康状态有关的信息段,放大正常与泄漏信息之间的差异性,从而增强模型的学习和表示能力,提高泄漏检测的准确率。
3)实验结果表明,所提模型能够成功地应用在天然气管道的泄漏检测中,且在检测精度方面优于其他分类方法。
1 相关工作
1.1 GRU算法原理
与传统前馈神经网络不同,RNN具有隐藏层到前一层的反馈连接,能够记忆之前时刻的信息,高效处理时间序列。然而,训练过程中出现的梯度消失和爆炸现象导致RNN无法有效地捕获之前时刻的有效信息。因此,本文使用RNN的一种变体——GRU作为基本框架来解决上述问题,核心思想是通过重置门和更新门来更有效地保留和传输数据中更多的隐藏信息。相较于其他RNN变体,GRU的计算成本更低、结构更简单、训练速度更快,其结构如图1所示。
图1 GRU结构图
GRU处理数据的过程如下:重置门决定有多少之前时刻的信息被传递到当前时刻;更新门决定有多少信息被补充到状态中并继续参与传递。具体过程如下:
由此可见,GRU利用ht-1和xt来获取两个门控状态和有效控制信息流动,从而有选择地保留和遗忘历史信息,提高模型的记忆能力及对隐藏信息的识别能力。
1.2 SSA算法原理
SSA是一种新颖的智能优化算法,模拟了麻雀的捕食和反捕食行为。每只麻雀被视为搜索空间中的一个粒子,在搜索空间中智能地移动和交互,不断优化对应的候选解决方案。麻雀种群根据觅食能力可分为“发现者”和“加入者”。“发现者”具有更强的觅食能力(即适应度值更大),负责搜寻食物的区域和方向信息;“加入者”则根据这些信息进行觅食,优化自身的解决方案。二者之间的转换是动态的,但它们在种群中的比例保持不变。此外,部分麻雀会被随机选为“侦察者”,当它们检测到威胁时,群体会发生反捕食行为并更新位置。这种随机选择的“侦察者”有助于提升麻雀种群的适应性和求解能力[33]。
1.3 AM算法原理
在人脑选择性视觉注意机制的启发下,学者们提出了一种智能资源分配机制——AM。在AM中,输入数据的状态通过函数被赋予相应的权重。通常情况下,异常信息由于具有较高的高幅值而被赋予更高的权重,以增强正常和异常数据的可区分性。通过这一机制,可以获得样本的有效信息表示,忽略与输出无关的信息,从而提高检测模型的性能。AM的结构图如图2所示。
图2 AM结构图
图中x=[x(1),x(2),…,x(NG-1),x(NG)]是输入数据,其中NG是数据段的数量;s=[s(1),s(2),…,s(NG-1),s(NG)]是每个数据段对应的非线性状态集合;α=[α(1),α(2),…,α(NG-1),α(NG)]表示每个数据段对应的注意力权重集合;H=[H(1),H(2),…,H(NG-1),H(NG)]表示每个数据段的加强特征集合;Concat(·)表示拼接操作,以保持提取信息的维度和原数据维度一致;Softmax和tanh表示对应层的激活函数。
2 基于SSA的门控注意网络
2.1 SGAN模型的构建
为了提高天然气管道泄漏检测的准确率,本文提出一种SGAN模型。首先,该模型以GRU为基本框架,有效地处理天然气管道数据的时间序列特性,并解决复杂的非线性和周期不确定性;其次,该模型将SSA的适应度函数和GRU的损失函数设置为相同的交叉熵函数,以此来优化模型的初始超参数(迭代次数、学习率),从而令SSA无缝整合到检测模型中,使得模型超参数的选择不再依赖专家经验,提高模型的稳定性;此外,该模型还提出一种异常注意机制,通过对隐藏状态进行加权发现类判别信息,进而放大正常与泄漏信息段之间的可区分差异。基于以上机制,所提出的SGAN模型不仅实现了网络超参数的自适应优化,还放大了泄漏数据段的贡献,从而克服了传统检测模型不稳定和泛化性能差的缺点。
图3 t时间步SGAN网络结构图
综上所述,SGAN模型的结构图如图3所示。首先,通过输入层来输入处理后的天然气管道数据;其次,通过SSA优化后的GRU构成的优化层获得输入数据的最优状态;然后,通过异常注意力层获得各数据段状态的注意力分数以突出泄漏特征,并通过拼接操作得到增强的数据信息;最后,通过输出层得到当前时刻天然气管道的泄漏检测结果。具体原理如下:
1)步骤1。由于工况不同,传感器采集到的天然气管道数据的量纲和范围也各不相同,直接输入未经处理的数据到模型中会导致训练不稳定,影响模型参数的更新。为了降低这种影响,将输入数据x进行归一化处理,即令所有数据映射到[0,1]中,使具有不同泄漏特征的数据具有相同的尺度,消除数据量纲差异,提高模型对不同泄漏特征的敏感度,确保模型能够快速收敛,提高泄漏检测的准确性。归一化的具体过程如下:
此外,在天然气管道的泄漏数据中,存在部分正常信号会干扰模型检测。因此,为了有效地检测泄漏部分,提取数据的局部特征,将xN等分为NG个数据段,其中每个数据段包含相同数量的数据点。
最后,按照一定的比例将处理后的数据划分为训练集和测试集。
2)步骤2。初始化神经网络的各层结构、麻雀种群的规模、迭代次数(iter)、学习率(LR)、个体的初始位置和安全阈值,并按照一定比例将麻雀种群分为“发现者”和“加入者”。
3)步骤3。计算种群中各麻雀的适应度函数值,将当前最优的位置设为食物的位置。其中SSA的适应度函数与GRU的损失函数一致,皆为交叉熵函数,其能够有效衡量模型在分类任务上的表现。这样设置能够使得麻雀的搜索过程与模型优化的目标一致,从而找到最优的初始超参数(迭代次数、学习率),使模型在检测天然气管道的泄漏时达到最佳性能。具体表达式如下:
4)步骤4。根据适应度值,按照式(8)、(9)更新“发现者”和“加入者”的位置,以不断探索新的超参数配置,提高模型对不同泄漏模式的适应能力。此外,随机选择部分麻雀为“侦察者”,按照公式(10)更新位置,可以避免陷入局部最优解,提高模型的全局搜索能力和稳定性。
5)步骤5。若未达到最大迭代次数,则重复步骤4、5;若达到最大迭代次数,则执行步骤6。
6)步骤6。达到最大迭代次数后,得到全局最优位置向量(最优迭代次数和学习率组成的多维坐标),并将最优超参数输入到GRU中得到优化后的模型,构成优化层,以此能够更精准地捕捉和处理天然气管道数据的时间依赖性和复杂性,使模型能够记忆和忘记适当的信息,从而提高对泄漏的检测能力。优化层从t时间步的数据样本xt中提取最优数据特征,具体表示如下:
7)步骤7。在天然气管道泄漏检测中,异常信号是关键识别因素。SGAN模型中的异常注意层通过对不同的隐藏状态段进行加权,突出泄漏信号的特征。这种机制可以放大正常数据段与泄漏数据段之间的可区分差异,使模型对泄漏部分更加敏感,从而提高模型的检测精度。异常注意层利用Softmax函数计算各个数据段状态的注意力分数,具体过程如下:
通过将αt(i)和t时间步第i个数据段的最优特征ht(i)相乘以放大正常数据段与泄漏数据段之间的差异,得到t时间步第i个数据段的增强表示Ht(i):
然后,将各个数据段的增强表示通过Concat操作拼接在一起得到t时间步的最终特征Ht,以提供更加全面和细致的数据信息,有助于模型更好地学习不同类型的泄漏特征,提高模型的泛化性能:
8)步骤8。将Ht输入到激活函数为Softmax的输出层中得到xt属于各泄漏类型的概率,以此确定该时刻管道的泄漏类型,为管道的监控和维护提供可靠的决策支持。此过程表述如下:
式中WH和bH分别表示输出层的权重向量和偏置向量。
2.2 SGAN模型结构图
综上所述,本文所提出的SGAN模型的流程图如图4所示。
图4 SGAN模型检测天然气管道泄漏的流程图
3 仿真实验
在本节中首先介绍数据集及实验设置。随后,利用相关评价指标对SGAN模型的性能进行评估,并对实验结果进行分析和讨论。
3.1 数据描述及预处理
本文所使用的数据集是通过天然气管道泄漏模拟实验平台中的声波传感器采集,管道总长度180 m,数据采集的过程中,设定压力为0.5 MPa,流速为10 m3/h,信号的采样频率为1 024 Hz(即数据维度为1024)。该数据集包含4种不同工况,分别是大泄漏(标签为0)、中泄漏(标签为1)、小泄漏(标签为2)和正常信号(标签为3),每种工况均包含1 000条电压信号(共4 000条数据),数据波形如图5所示。数据经处理后,按照7∶3的比例划分为训练集和测试集,并将数据平均分为4个数据段(即NG=4)。
图5 实验数据波形图
3.2 实验设置
3.2.1 对比模型
为了验证所提模型的优越性,本文将SGAN模型的性能与一些分类算法进行比较,包括RNN[34]、LSTM[35]、FFT-BiLSTM[36]、WCNN-BiGRU[37]、PSOGRU[38]、ImConvLSTM[39]和ConvGRU[40]。此外,为了验证SGAN模型中各成分的有效性,本文进行了消融实验,即将SGAN模型与GRU、SSA-GRU和GRU-AM进行比较。
3.2.2 实验参数设置
本文的所有实验均在一台配备Intel Core i7-11700 2.50 GHz处理器和Microsoft Windows 10 Enterprise 64位操作系统的服务器上使用Python3.6实现。实验中所用到的主要参数取值如表1所示,为了确保实验的公平性,所有模型都共享同样的参数。需要说明的是,本文需要优化的超参数是iter和LR,为了模型的训练,仍需根据经验选取初始值,分别为3 000和0.000 1。此外,对于PSO-GRU模型,PSO的粒子数为30,惯性权重为0.5,加速度系数为2,PSO的迭代次数为20。
表1 参数设置表
3.2.3 评价指标
为了评估模型的分类性能,本文使用准确率(acc)、召回率(rec)、漏报率(Missing Alarm Rate, mar)和误报率(False Alarm Rate, far)作为评价指标,相关的表达式如下:
acc是所有预测正确的样本数量与总样本数量的比值,其值越大,模型的性能越好。
式中TP表示被正确分类的泄漏样本数量;TN表示被正确分类的正常样本数量;FP表示被误分类的正常样本数量;FN表示被误分类的泄漏样本数量。
rec是所有预测正确的泄漏样本数量与所有泄漏样本数量的比值,其值越大,模型的性能越好。
mar是所有预测为正常的泄漏样本数量与所有泄漏样本数量的比值,其值越小,模型的性能越好。
far是所有预测为泄漏的正常样本数量与所有正常样本数量的比值,其值越小,模型的性能越好。
3.3 实验结果与分析
3.3.1 模型有效性分析
为了验证SGAN模型在天然气管道泄漏检测中的有效性,本文绘制了训练过程中SGAN模型的准确率和损失函数值的变化曲线,分别如图6和图7所示。图中的横坐标均表示迭代次数,纵坐标分别表示准确率和损失函数值。通过观察图6,可以发现随着迭代次数的增加,SGAN模型的准确率先逐渐上升,然后趋于稳定。在迭代结束时,测试集和训练集上的准确率接近。这表明SGAN模型通过GRU能够有效地学习更抽象、更高层次的管道泄漏特征,并通过AM机制突出关键泄漏特征,从而实现高效分类。此外,由图7可知,随着迭代次数的增加,损失函数值逐渐减小并趋于稳定,且曲线呈平滑的趋势。这说明所SGAN模型能够通过SSA寻找最优超参数,更好地捕捉重要信息,在不同工况下表现出色,且避免了过拟合现象。此外,模型准确率的提升和损失函数的降低意味着检测过程中的误报和漏报减少,为天然气管道的泄漏检测提供了技术支持。需要说明的是训练结束后所得到的模型最优超参数组合是:(3 253, 1.076 5×10−5)。
图6 SGAN模型准确率变化曲线图
图7 SGAN模型损失函数值变化曲线图
3.3.2 对比实验分析
为了验证SGAN模型在天然气管道泄漏检测中的优越性,本文将SGAN模型的性能与一些分类算法进行比较,包括RNN、LSTM、FFT-BiLSTM、WCNN-BiGRU、PSO-GRU、ImConvLSTM和ConvGRU。需要说明的是,为了减少单次实验的偶然性,每个模型都进行了10次训练。图8展示了各模型在10次训练中各评价指标的箱线图,其中箱内的横线表示各指标的中位数,箱外圆点表示异常值。从图8-a、b可以看出,SGAN模型准确率和召回率的箱线图的箱长最短、中位数最高且没有出现异常值,表明其在10次训练中的准确率波动最小且总体表现最佳,在不同工况下都能保持较高的性能。相较其他模型,SGAN模型能够可靠地识别管道泄漏,确保管道能够得到及时的修复,提高天然气管道的安全性。从图8-c、d可以看出,SGAN误报率和漏报率的箱长相对更短、中位数最低且没有出现异常值,表明其不仅能有效检测泄漏事件,还能减少误报和漏报的发生,降低不必要的检修和成本维护,节省了时间和资源,提升天然气管道的管理效率。此外,图9展示了各个指标平均值的条形图,SGAN模型在所有指标上均取得了最佳效果,进一步证明了其优越性。综上所述,SGAN模型的高稳定性和自适应优化超参数的能力使其能在不同工况下精准、高效地检测泄漏事件,确保天然气管道系统能够及时得到维护,降低重大事故的风险,进一步增强了其在天然气管道泄漏检测中的应用价值。
图8 各模型的评价指标箱线图
图9 各模型评价指标的平均值直方图
3.3.3 消融实验分析
为了验证SGAN模型中各组成部分的有效性,本文进行了消融实验,即将SGAN模型的性能与GRU、SSA-GRU和GRU-AM进行比较,并将各模型的混淆矩阵统计在图10中。可以看出,SGAN模型对4种工况的分类准确率最高,分别为100%、98%、98%和91%,仅有2%的中泄漏样本被误分类为正常信号,2%的小泄漏样本被误分类为大泄漏,以及各有4%、1%和4%的正常样本被误分类为大泄漏、中泄漏和小泄漏。然而,GRU-AM虽然增强了模型对泄漏特征的敏感性,但缺乏SSA的全局优化能力,模型的训练过程不稳定,导致整体性能下降,无法提取更具鲁棒性的泄漏特征,致使有2%的大泄漏样本被误分类为中泄漏,2%和7%的中泄漏和小泄漏样本被误分类为正常信号,以及各有2%、6%和13%的正常样本被误分类为大泄漏、中泄漏和小泄漏;SSA-GRU尽管在优化超参数方面表现较好,但未能有效地定位泄漏部分,导致模型的学习表示能力和泛化能力下降,从而降低了模型的识别能力,致使有2%和1%的中泄漏样本被误分类为大泄漏和正常信号,2%和4%的小泄漏样本被误分类为大泄漏和中泄漏,以及各有18%、9%和5%的正常样本被误分类为大泄漏、中泄漏和小泄漏;GRU由于缺少上述机制,致使有2%的中泄漏样本被误分类为大泄漏,9%的小泄漏样本被误分类为正常信号,以及各有35%、14%和16%的正常样本被误分类为大泄漏、中泄漏和小泄漏。这些结果进一步验证了SGAN模型在天然气管道泄漏检测中的有效性。各部分的协同作用使得模型在不同泄漏工况下都能保持高准确率,在天然气管道的泄漏检测中展现出良好的实用性。
图10 各模型的混淆矩阵图
4 结论
1)将GRU的损失函数和SSA的适应度函数设定为相同的交叉熵函数,使得SSA无缝整合到检测模型中,实现模型超参数的自适应优化,进而提取更具鲁棒性的数据特征。
2)提出了一种异常注意力机制(AM)来使模型更加关注泄漏部分数据,有效地提高了模型的学习表示能力和泛化能力。
3)将所提出的SGAN模型应用在天然气管道泄漏检测中。实验结果表明,SGAN模型在天然气管道泄漏检测中的准确率和召回率分别达到96.31%和95.98%,相比其他7种检测模型,提升的总体性能平均为15.13%和14.26%;误报率和漏报率仅为1.07%和4.02%,相比7种检测模型,提升的总体性能平均为4.33%和13.27%。以上结果皆验证了本文提出的SGAN模型在天然气管道泄漏检测的有效性和优越性。
论文原载于《天然气工业》2025年第1期


发布者:cubeoil,转转请注明出处://www.mirrorballz.com/archives/99116