An Explainable Artificial Intelligence Framework for Analyzing Health Degradation of Aero-Engines
As a complex and critical mechanical equipment, the health status of aircraft engines directly affects flight safety and operational efficiency. Given the limitations of current health status monitoring technologies in terms of interpretability and accuracy, this paper proposes an interpretable artificial intelligence analysis framework based on Shapley values. This framework reveals the fundamental cause of engine health decline by analyzing the prediction results of machine learning models. Firstly, the Shapley value analysis method was used to evaluate the marginal contribution of each sensor data feature, identifying the key factors affecting the health of aircraft engines and their degradation paths. Next, the HDBSCAN clustering algorithm is applied to identify engines with potential fault risks. Finally, SkopeRules is used to extract a set of rules from clustering that are easy to understand and highly accurate, as an alternative to complex model decision-making, enhancing the transparency and reliability of the model output results. The experimental results indicate that the framework can reveal the evolutionary path of health decline in aircraft engines, providing reliable theoretical support for achieving precise maintenance.
Shapley Values
航空发动机作为飞机的关键动力源,其健康状况直接关乎飞行安全。航空发动机长期在高温、高压、高转速环境下运行,频繁遭受剧烈振动和冲击,极易导致发动机健康衰退,进而产生发动机推力不足、燃油效率降低等问题,严重时甚至可能引发灾难性事件。因此,通过航空发动机健康衰退研究,及时发现并预防故障隐患,对于保障飞行安全具有重要意义。
早期航空发动机健康衰退研究主要依赖于复杂的物理模型,涵盖材料、结构、热力学和流体力学等多个方面。例如,丁小飞等
随着数据处理技术的快速发展,人工智能已成为重要的分析工具。通过对庞杂的发动机运行数据进行剖析并提取关键特征,从而构建发动机健康状态预测模型。孙同敏
尽管人工智能技术以其信息处理优势能够实现高精度预测,但在航空工业这一对安全要求极其苛刻的领域中,任何微小的概率误差都可能酿成灾难。因此,提升模型的透明度、增强其可靠性和稳健性对于推动人工智能技术在航空工业中的广泛应用显得尤为重要。所以,周志杰等
尽管现有研究展示了人工智能在航空发动机健康管理中的显著成效,并初步探索了模型的可解释性。但仍存在若干不足,目前提升决策透明度的策略主要依赖于专家经验制定的规则和设计可解释的模型结构。传统规则易于理解但难以适应高维动态特征空间;而基于可解释模型结构的方法虽能较好处理高维数据,但其解释机制易随模型结构变化而失效。为克服这些局限,本文构建了一种基于Shapley值的可解释人工智能框架。该框架通过预测航空发动机健康状态,利用Shapley值进行特征重要性分析,并结合聚类技术和规则挖掘算法,形成一种模型无关且高度可解释的技术方案。此框架不仅能够深入解析发动机健康衰退机制,还具有广泛应用于工业装备健康管理及故障预诊断的潜力。
为了深入剖析航空发动机健康状态退化的内在机制,本文构建了一种基于可解释人工智能技术的分析框架如
Shapley值的概念起源于博弈论,其理论基础在于对参与者个体贡献的量化分析,即在一个协作环境中,每位参与者的边际贡献取决于参与者进入合作序列的位置及其对于最终成果的影响程度。随着理论框架的不断演进,Shapley值逐渐成为解析模型内部机制的关键手段之一,并由Lundberg
(1)
其中, 表示基准预测值,X为测试样本集合, 表示第i个特征对发动机样本x健康状态预测结果的具体影响度量,可通过下述公式精确计算得出:
(2)
其中,F代表所有特征集合,N代表特征总数,S表示不含特征i的任意子集,f则是预测模型, 反映了添加特征i后相对于原有子集S预测输出的边际增益变化。
进一步地,为了从全局视角考察某一特定特征在整个数据集内对模型表现的平均影响力,定义特征i的整体Shapley值如下所示:
(3)
通过Shapley分析方法,不仅能够量化单个因素的重要程度,也能揭示出各因素间复杂的交互作用模式,为后续开展针对性维护策略制定提供了坚实的理论依据。
UMAP
1) 计算高维空间中的局部相似性
UMAP首先在高维空间中为每个数据点构建一个局部邻域图,领域图通过构建每个数据点的k最近邻点实现。对于高维空间中的点 和 ,其局部相似性计算公式为:
(4)
其中, 是以 中心的高斯核的带宽超参数,通常根据邻域内点的密度来确定, 表示 的k近邻集合。为了使矩阵对称,使用以下公式计算最终的相似性矩阵,n是数据点的数量:
(5)
2) 优化低维嵌入
在低维空间中,UMAP试图找到一个嵌入 ,使得低维空间中的分布 尽可能接近高维空间中的分布 ,然后通过最小化高维和低维空间分布之间的交叉熵来优化数据在低维空间中的布局,并通过梯度下降等优化算法进行求解,以找到最佳的低维嵌入。优化目标为:
(6)
HDBSCAN作为一种基于密度的空间聚类技术,在DBSCAN的基础上进行了改进,能够更有效地处理不同密度级别的聚类及噪声点,从而揭示数据内部的潜在子群。相较于传统的k-means
1) 计算互达距离:给定半径 和最小样本量超参数,对于每一对点p和q,计算它们之间的互达距离。
(7)
(8)
其中, 表示p点到第k个邻点的距离, 是p点的核心距离, 为点p和q之间的欧式距离。
2) 构建最小生成树:基于互达距离构建一个邻域图,其中每个点都与它的近邻点相连,连接边的权重为该点与邻点的互达距离,然后基于Kruskal等算法构建最小生成树。
3) 生成层次聚类树:基于构建好的最小生成树,从树中选择权重最小的边,将这条边所连接的两个顶点合并成一个新的簇。重复此过程直到所有点都被合并,以此形成一个自底向上的层次聚类树。
4) 切割树并选择最优簇:为了选择最优的簇集合,评估不同层次上的簇稳定性,选择表现出较高稳定性的层次作为最终的簇集合。在最终确定的簇中,不属于任何簇的点被视为噪声点。
SkopeRules是一种用于学习规则的机器学习方法,通过生成一组易于理解的逻辑规则进行分类。规则生成和选择过程可以描述为下步骤:
1) 初始化:选择一个特征子集F和一个初始规则集合 。
2) 规则生成:对于每个特征 ,生成一系列候选规则 ,j表示规则序号。
3) 规则评估:对于每条规则 ,计算性能指标,包括精确率、召回率、F1分数。
4) 规则选择:选择F1分数最高的规则加入规则集合R。
5) 重复规则生成、评估、选择步骤,直到没有更好的规则可添加或者达到预设的停止条件,最后输出规则集合。
本研究采用的数据来自NASA Ames研究中心、苏黎世联邦理工学院及PARC联合开发的CMAPSS动态模型生成的N-CMAPSS
变量符号 |
描述 |
单位 |
hs |
健康状态 |
- |
RUL |
剩余使用寿命 |
年 |
cycle |
飞行周期 |
- |
Fc |
飞行等级 |
- |
alt |
海拔 |
ft |
March |
飞行马赫数 |
- |
TRA |
节气门开启角度 |
% |
T2 |
风扇入口处总温度 |
˚R |
Wf |
燃油流量 |
pps |
Nf |
物理风扇速度 |
rpm |
Nc |
核心机物理转速 |
rpm |
T24 |
低压压气机(LPC)出口处总温度 |
˚R |
T30 |
高压压气机(HPC)出口处总温度 |
˚R |
T48 |
高压涡轮(HPT)出口处总温度 |
˚R |
T50 |
低压涡轮(LPT)出口处总温度 |
˚R |
续表
P15 |
旁路管道中总压力 |
psia |
P2 |
风机入口处总压力 |
psia |
P21 |
风机出口总压力 |
psia |
P24 |
低压压气机(LPC)出口处总压力 |
psia |
Ps30 |
高压压气机(HPC)出口处静压 |
psia |
P40 |
燃烧器出口总压力 |
psia |
P50 |
低压涡轮(LPT)出口处总压力 |
psia |
本研究专注于航空发动机健康状态评估,结合Shapley值分析以识别关键影响因素。基于分析结果,采用UMAP技术进行数据降维,并运用HDBSCAN聚类算法识别潜在故障发动机,进一步通过SkopeRules方法对聚类结果提取规则,进而实现复杂模型透明化,为不同衰退程度的发动机提供维护策略与优化建议。具体实验步骤如下:
1) 数据预处理:从18个时间序列变量中提取了7个关键统计特征:平均值、标准差、最小值、四分之一位数、中位数、四分之三位数和最大值,例如LPT出口处总温度的特征表示为T50_mean、T50_std、T50_min、T50_Q1、T50_median、T50_Q3、T50_max。此外,还加入了飞行周期和飞行等级两个辅助变量,共128个特征。通过对不同发动机在多个运行周期内的这些特征进行提取,构建了一个包含6825个样本的数据集,并进行归一化处理。最终,按8:2的比例随机划分为训练集(5460个样本)和测试集(1365个样本)。
2) 模型训练:为有效提取航空发动机健康衰退的关键信息,本文构建了两个模型:神经网络模型M1和XGBoost分类模型M2。M1采用三层前馈神经网络,包含两个48神经元的隐藏层和一个2节点的输出层,使用ReLU作为激活函数。M2基于XGBoost算法,设置100棵决策树、最大深度为4,并引入L1正则化以增强泛化能力。经过训练优化,两个模型在F1分数上均超过90%。
3) Shapley值分析:基于训练完成的M1和M2模型对测试集进行预测。然后,计算测试集中每个特征对于预测结果的Shapley值。通过对Shapley值的分析,揭示各个特征变量对于预测结果的贡献度和排序,并对两个模型的解释结果进行对比分析,从而求证Shapley值分析法的模型无关性。
4) 聚类分析:首先,运用UMAP方法分别对原始特征以及M1模型的Shapley值进行降维处理。随后,利用HDBSCAN算法对降维后的结果进行聚类分析,探索发动机健康状态中的潜藏子群体。最后,探究各子群体中发动机的剩余使用寿命特性。
5) SkopeRules分析:基于聚类分析的结果,运用SkopeRules算法方法来探索聚类子群中的潜藏模式,并从中推导出高精度透明化的规则集合。
在实施Shapley值分析的过程中,为了全面评估M1和M2模型的性能,采用了精确率、召回率、F1分数作为评估指标。如
标签 |
精确率 |
召回率 |
F1分数 |
|
M1 |
0 (不健康) |
0.982 |
0.992 |
0.986 |
1 (健康) |
0.984 |
0.966 |
0.974 |
|
M2 |
0 (不健康) |
0.990 |
0.990 |
0.990 |
1 (健康) |
0.973 |
0.982 |
0.977 |
在航空发动机健康状态预测方面,M1和M2模型均表现出显著的有效性。然而,对于处于非健康状态的发动机,这两个模型未能揭示其健康衰退的具体原因。为此,本研究引入Shapley值分析法以量化并排序各特征对两模型预测结果的贡献度,进而探究发动机健康衰退的根本因素。
通过对
飞行等级 |
飞行时长(小时) |
飞行次数 |
1 |
1~3 |
18 |
2 |
3~5 |
149 |
3 |
>5 |
185 |
在上述Shapley分析中,我们得知飞行周期是航空发动机健康衰退最重要的因素,并且随着飞行周期的逐渐增加,其健康状态呈现逐渐衰退的趋势,表明了健康与不健康状态之间边界的模糊性,两者间缺乏一个绝对的阈值区分。为深入探究介于这两种明确状态之间的其他潜藏状态,本文采用HDBSCAN算法对样本数据进行聚类分析。旨在识别健康与不健康类别之外的样本群体,并揭示这些样本群内在的分布规律。
为了更为直观地展示聚类结果,本文采用UMAP方法对特征进行降维,UMAP关键参数如
参数名称 |
参数值 |
最近邻点数量 |
200 |
样本间最小距离 |
0.01 |
嵌入的维度 |
2 |
距离度量方法 |
correlation |
迭代次数 |
500 |
根据上述UMAP方法降维得到低维特征向量UMAP_1和UMAP_2,并采用HDBSCAN算法对测试样本进行聚类,HDBSCAN算法的关键参数如
参数名称 |
参数值 |
最小样本数 |
200 |
核心点最小邻居数 |
10 |
距离度量方法 |
euclidean |
最近邻方法 |
kd_tree |
HDBSCAN聚类算法应用于低维特征向量的结果如
从
在上述实验结果中,我们识别出一类具有潜在风险的航空发动机,其特征表现为剩余使用寿命介于健康与不健康状态之间。基于此发现,本研究根据平均剩余使用寿命将航空发动机重新分类为健康、亚健康和不健康三类。为进一步提高模型决策过程的透明度,并直观描述各类别形成的条件,采用SkopeRules方法对这三种健康状态进行规则提取,其结果见
本文采用Python中的SkopeRules工具对聚类结果进行描述性规则提取,其关键参数设置如
参数名称 |
参数值 |
树的最大去重深度 |
3 |
树的数量 |
100 |
最小精确度 |
0.5 |
最小召回率 |
0.5 |
通过SkopeRules对发动机健康状态三大类别提取的规则如
健康状态 |
规则 |
精确率 |
召回率 |
F1分数 |
健康 |
飞行周期数 ≤ 34.5 飞行等级 ≤ 1.5 |
0.701 |
0.933 |
0.801 |
亚健康 |
飞行周期数 ≤ 36.5 飞行等级 > 1.5 |
0.995 |
0.950 |
0.972 |
不健康 |
飞行周期数 > 36.5 |
0.998 |
0.975 |
0.986 |
从
本研究提出了一种基于Shapley值的可解释人工智能框架,旨在深入探讨航空发动机健康状态退化机制。通过该框架的应用,实现了对各个因素对航空发动机健康影响的量化评估,揭示了健康衰退机制。研究结果表明,在所有考虑因素中,飞行周期数对发动机健康状态的影响最为显著。此外,研究证实了无论是采用神经网络模型还是基于决策树算法的集成学习模型,运用Shapley值分析所获得的结果均表现出高度一致性。进一步地,将Shapley值与UMAP降维方法及和HDBSCAN聚类算法相结合,有效地从健康发动机中甄别出潜在风险较高的亚健康发动机群体,并通过SkopeRules工具对处于不同健康水平的发动机群体进行规则归纳,明确了飞行周期是区分发动机是否开始进入不健康阶段的关键指标,而飞行等级高低是判断发动机是否维持健康状态或已步入亚健康状态的重要依据。这不仅验证了所提框架在不同预测模型之间具有良好的无关特性,还识别出了发动健康衰退的关键因素,明确了健康衰退过程中的关键转折条件,为实施航空发动机的预防性维护提供了坚实的理论依据。
本文利用N-CMAPSS数据集,评估了基于Shapley值的可解释人工智能框架在航空发动机健康状态预测中的有效性,揭示了发动机退化机理,并加深了对健康衰退过程的理解,从而为实现经济效益的预测性健康管理提供了支持。尽管如此,Shapley值计算的高成本限制了其实用性,且在非线性模型中,其解释力相较于线性模型显得更加抽象。因此,未来的研究需聚焦于提高计算效率及开发更直观的非线性特征解释方法,以促进可解释人工智能技术的发展与广泛应用。
中电天奥产业发展基金“风电场智慧运维大数据平台”(202201090404)。