当前位置: 主页 > 学术动态 >

可扩展活动子空间低秩图表示用于输入损坏的连续系统在线安全评估

作者:   文章来源:   点击数:   更新日期: 2021-12-22

论文题目: Scalable active subspace low-rank graph representation for continuous system online security evaluation with input corruption

发表期刊: Process Safety and Environmental Protection, 2021 (JCR Q1, 中科院2区, SCI)

原文DOI: https://doi.org/10.1016/j.psep.2021.12.003

作者列表:

1) 张明卿 中国石油大学(北京)信息科学与工程学院 自动化系博18

2) 张   伟 中国澳门特别行政区澳门理工学院应用科学学院

3) Min-Sen Chiu, 新加坡国立大学 化学与生物分子工程系

4) 罗雄麟 中国石油大学(北京)信息科学与工程学院 自动化系  (通讯作者)


文章简介:

持续的在线系统运行评估旨在监控异常情况的发生。然而,目前流行的监控方法大多是从历史数据完整性的角度发展起来的。在工业过程中,由于记录不当或传感器丢失,通常存在丢失或损坏的条目,这给在线监测评估带来了困难。在本文中,提出了一种可扩展的活动子空间低秩图表示方法来处理故障监测离线阶段的缺失数据。该方法通过低秩表示和可伸缩正交矩阵的线性组合实现干净矩阵的重构。同时,在损失函数中安排了低秩表示和具有L2,1-范数的稀疏误差矩阵,以提高模型的最优特征选择和鲁棒性。此外,为了保持重建空间和原始损坏空间之间相邻结构的一致性,进一步设计了拉普拉斯流形正则化来约束稀疏误差。最后,为连续系统的在线安全监控建立了恢复数据的最优图判别模型。通过对基准TE过程和实际多相流过程的模拟以验证提出的方法在存在特定损坏时的鲁棒性以及可检测性性能。


设计与实现

  1. 通过低秩表示和可伸缩正交矩阵的线性组合实现干净矩阵的重构。

  2. 低秩表示矩阵和稀疏误差矩阵引入L2,1-范数提高模型的最优特征选择和鲁棒性。

  3. 设计拉普拉斯流形正则化来约束稀疏误差保持重建空间和原始损坏空间之间相邻结构的一致性。

    为此,构造的损失函数为:

进一步被改写为:

涉及到的参数优化问题采用ADMM进行求解:


当得到干净数据的重构即QJ以及T判别方向后构建对应的检测指标为:

检测逻辑满足于:

在我们的研究中,考虑到数据分布的不确定性,检测阈值采用核密度估计KDE计算。


实验结果及分析

为表明目的方法的优越性,我们将其算法应用到实际多相流过程。多相流过程旨在为增压系统提供可测量的水、油和空气流速。该工艺由多种孔板、管道和气液两相分离器组成,根据实际需要提供空气、水、油等物质。混合流体被分离到卧式三相分离器中。空气由两个压缩机的组合提供。整个系统采用艾默生过程管理提供的现场总线,便于数据控制和采集,数据采样率为1Hz。在本研究中,23个不同的过程变量参与了故障检测。故障来源:气路和水路被堵塞,影响了阀VC404顶部分离器的输入。由于阀门的固有特性,当接近全开时,压降变化不明显,但对接近全关的变化非常敏感。因此,故障会先迅速发展,然后随着阀门开度的变化而逐渐消失。

恢复性能分析:为了验证缺失数据的恢复性能,通过保留80%累计贡献计算得到的线性子空间的潜在变量个数为6,且假设子空间潜在变量阶次为1。经计算,模型允许的缺失率≤52.77%。因此,我们给出了数据缺失10%-50%时插补的恢复性能。‘-’表示数值超过50%或大量缺失值并没有发生变化仍然为0。我们采用相对平均误差和均方根误差作为评价模型恢复能力的指标,从表1中的数值可以看出,我们所提方法较传统方法有明显的提升。

表1 多相流过程数据恢复结果

Missing cases

Random Missing

10\%

20\%

30\%

40\%

50\%

传统方法

RMSE

23.64

28.57

37.75

-

-

RE

27.77

32.85

41.89

-

-

我们方法

RMSE

15.61

17.81

23.55

27.00

32.71

RE

16.10

18.37

23.88

27.29

32.73

Sensor drop-out

10\%

20\%

30\%

40\%

50\%

传统方法

RMSE

23.61

27.26

36.57

-

-

RE

27.44

30.94

39.65

-

-

我们方法

RMSE

15.71

20.39

24.26

28.92

31.15

RE

16.09

20.81

24.96

29.29

31.30

由于考虑到实际的工业过程数据不可能存在缺失50%的情况,因此,在故障检测的案例中模拟数据分别随机缺失10%和连续缺失20%。



图1 (a)数据随机缺失10% (b)数据连续缺失20%

检测性能分析:从上述图1中的数值结果可以看出,所提方法即SASLRG的平均ACC约为98.57%,高于2.46%(PCA)、1.96%(LPP)、1.15%(ASLRR)、1.19%(ALRP)、0.97%(LRPP-GRR)。与Pchip插值方法相比,低秩约束方法可以检测到大部分故障点并带来较低的误报率。这表明矩阵的低秩属性有助于提高模型对噪声或异常值的容忍度。ASLRR和ALRP方法虽然引入了秩稀疏约束,但忽略了原始空间的几何结构,因此监控性能低于我们所提出的方法。缺失数据空间和重建空间应该具有相同的邻居结构。LRPP-GRR方法保留了低维空间的流形结构,但缺乏对误差矩阵的稀疏约束,导致重构数据中存在噪声或异常信息。


作者简介:

罗雄麟,博士。现任中国石油大学(北京)教授、博士生导师、自动化专业(教育部高等学校特色专业)负责人、控制科学与工程(博士一级)学科负责人,校学术委员会委员、校学位委员会委员。北京人工智能学会理事会常务理事、北京自动化学会理事会常务理事。控制理论与过程控制、化工系统工程、机器学习学者。科研工作涉及控制理论及应用、过程控制工程、过程系统工程和机器学习等,同时长期从事炼油化工过程软测量仪表与先进控制、过程流程模拟与实时优化等技术开发与工程应用工作。