A Diesel Engine Fault Detection Algorithm Based on Differential Analysis and Boxplot
With the continuous development of railway transportation, the safety and reliability of locomotives have become increasingly important. This paper proposes a locomotive fault detection algorithm based on differential analysis combined with boxplot, aimed at real-time monitoring of diesel engine operating conditions. The algorithm compares the cylinder head exhaust temperature data of 12 cylinders of a locomotive diesel engine and uses relative difference analysis/boxplot to identify potential faults and anomalies. By establishing a differential matrix combined with boxplot, the method can quickly locate abnormal cylinders, enhancing the sensitivity and accuracy of fault detection. Experimental results demonstrate that the algorithm can effectively identify faults in locomotive diesel engines, provide early warnings, and assist in preventive maintenance, thereby improving the reliability and lifespan of locomotives. Compared with traditional fault detection methods, the differential analysis and boxplot method proposed in this paper shows significant advantages in practical applications, offering an innovative and efficient technical means for the safe and stable operation of locomotive systems.
Internal Combustion Locomotive
在铁路运输中,机车的安全性和可靠性对于保障列车的正常运行至关重要。柴油机作为内燃机车的核心动力装置,其工作状态直接影响机车的运行效率和安全性。为了提高柴油机的运行可靠性和寿命,及时检测并排除潜在的故障成为一个重要的研究方向。传统的故障检测方法通常依赖于固定阈值判断,可能无法及时发现一些潜在的、渐进的故障。近年来,随着大数据分析和人工智能技术的快速发展,机车柴油机故障检测领域得到了广泛的研究和应用。研究人员不断探索新的算法和技术,力求提高故障检测的准确性、实时性和智能化水平。比如采用新一代传感器,其具备高频采样能力,并可在传感器端嵌入边缘计算功能,实时处理数据,减少传输延时,为故障的早期发现提供技术支持;或者箱线图嵌入柴油机监控界面,提升了运维工程师的故障分析效率;抑或将柴油机的运行状态数字化,并建立虚拟模型,通过模拟未来运行状态来预测潜在故障。
本文提出了一种基于差异分析 + 箱线图的机车故障检测算法,旨在通过对机车柴油机12个气缸的缸头排温数据,进行相对差异分析,之后结合箱线图的异常检测,实现对机车故障的早期预警和精准定位,可以自动识别潜在故障和异常值。实验结果表明,此方法能够有效提高故障检测的准确性,减少误报率和漏报率,进而为机车的预防性维护和运行优化提供科学依据。
内燃机车是利用内燃机(通常指柴油机)作为动力来源来驱动机车运行的。这种机车的工作原理是通过压缩空气产生的高温引燃喷入气缸的柴油,从而驱动活塞运动
内燃机车中,柴油机产生的机械能通过传动装置传递到车轮,推动机车前进。现代内燃机车通常采用电力传动系统,即柴油机驱动发电机发电,电力再驱动牵引电动机,带动车轮转动。这种设计的优点在于可以更灵活地控制功率输出,提高效率和稳定性。但是这种方式的核心动力来源,仍然是柴油机的机械能。
缸头排气温度(Cylinder Head Exhaust Temperature, CHET)是指柴油机每个气缸排气的温度
在柴油机故障检测中,缸头排温(CHET)是一个重要的参数。缸头排温可以帮助检测气缸内的燃烧状态以及其他相关问题,因为不同气缸的排温差异可能预示着潜在的故障。
缸头排温故障检测实现过程如下:首先将温度传感器安装在每个气缸的排气口位置,确保能够实时监测到每个气缸的排气温度。数据采集频率根据柴油机的工作特性和监测要求进行设置,目前机车柴油机传感器数据采集频率为每秒钟1次或者5次。数据采集模块将温度数据传输到中央处理系统,进行实时处理和存储。在中央处理系统上可以实时显示各气缸的排气温度,便于操作人员监控柴油机的工作状态,当某个气缸的排气温度超过或者低于预设阈值时,系统会发出警报,提醒操作人员进行检查和维护;同时中央处理器也会将收到的监测数据存储到行车记录仪中并且通过无线网络将这些数据发送到地面接收服务器。在中央处理器或者地面服务器中,可以通过数据分析和机器学习算法,将当前温度数据与历史数据进行对比分析,建立柴油机故障预测模型,预测潜在的故障。其中整个系统架构如
传统的缸头排温检测方法通常对其中所有的缸头排温设定单一的阈值,判断缸头排温是否异常,超过或低于某阈值的温度被视为异常
现代基于数据驱动的方法如机器学习和统计分析,则能够更灵活地处理复杂的温度变化模式,并且可以基于历史数据和实时监测数据学习和调整模型,从而实现更精确和可靠的故障检测和预测性维护。
差异分析是一种用于比较和分析数据之间差异的方法,通过计算一组数据之间的两两相对差异变化的大小和方向,来分析和揭示其系统内部潜在的故障或异常情况。
差异分析在许多领域都有着广泛的应用。在生物学和医学领域,可以比较不同组织或不同条件下基因表达的差异,识别关键调控基因或疾病相关基因
箱线图(Boxplot)也称箱须图(Box-whisker plot),是1977年由美国的统计学家约翰·图基(John Tukey)发明的。它是通过五个数据点来描述数据的一种方法。具体的五个数据点组成分别是:最小值/下限(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值/上限(max)。也可以往盒图里面加入平均值(mean)。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线称为“胡须(whisker)”,因形状如箱子而得名。在各种领域中也经常被使用,常见于品质管理,快速识别异常值。
箱线图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。箱线图可以通过程序设置一个识别异常值的标准,即大于或小于箱线图设定的上下界的数值则识别为异常值。
箱线图在各个领域的研究中都有广泛应用,特别是在数据分析、异常检测、预测模型等方面。箱线图用于异常检测,结合指数加权平滑法进行预测建模。箱线图通过展示数据的中位数、四分位数及异常值来识别潜在的异常数据点。这些异常数据可能影响预测模型的准确性,因此箱线图可帮助剔除异常值或进行特殊处理。通过此方法,指数加权平滑预测模型可以更准确地捕捉数据的趋势,从而提高预测精度
机车柴油机气缸的12个缸头排温数据可以反映柴油机的运行状态和健康状况。差异对比分析是通过比较各气缸缸头排温之间的差异,识别出异常气缸,通过箱线图可以发现潜在的故障。
计算12个缸头排温的均值(Mean Temperature):
(1)
其中 为第(i)个缸头的排温。
计算每个缸头排温与均值的差异(Difference from Mean)。
(2)
其中 为第(i)个缸头排温与均值的差异。
构建12个缸头排温的差异矩阵(Difference Matrix),计算任意两个缸头排温之间的差异。
(3)
其中 为第(i)个缸头和第(j)个缸头排温数值差异。
四分位数,就是把一组数据按照从小到大的顺序进行排列,然后分成四等份,处于三个分割点位置的数字就是四分位数。
下四分位数Q1 (Quartile1):又称“第一分位数”,是该样本中所有数值由小到大排列后第25%的数字,Q1的位置 = (n + 1) * 0.25,其中n为项数。
中位数Q2 (Quartile2):又称“第二四分位数”,是该样本中所有数值由小到大排列后第50%的数字,Q2的位置 = (n + 1) * 0.5,其中n为项数。
上四分位数Q3 (Quartile3):又称“第三四分位数”,该样本中所有数值由小到大排列后第75%的数字。Q3的位置 = (n + 1) * 0.75,其中n为项数。
四分位间距IQR (Inter Quartile Range):上四分位数与下四分位数的差值(Q3数据 − Q1数据)。
上限:又称“whisker上限”,大于该值即为异常值,Q3数据 + whis * IQR,(whis对应于箱线图原始定义,是一个系数,表示超过的比例,可以调整)。
下限:又称“whisker下限”,小于该值即为异常值,Q1数据 − whis * IQR,(whis对应于箱线图原始定义,是一个系数,表示超过的比例,可以调整)。
通常对于whis = 1.5与whis = 3.0之间的异常值,称为潜在异常值,可以继续观察使用;而对于超过whis = 3.0的值,称为异常值,需要对此类异常进行处理。
在内燃机机车的运行过程中,通过缸头的排温数据可以反映柴油机的工作状态和健康状况。本实验研究选取某主机厂干线铁路的4台机车,每台机车均拥有12个气缸,12个气缸一起协同工作,以实现高效的燃烧和动力输出。通过对12个气缸的数据进行相对差异分析,结合箱线图的方法进行实验研究。数据采样频率是每秒钟一条数据,即每一秒钟记录一次12个缸头排温数据。
八号机车数据采集时间是2024年6月1日到2024年7月1日,数据量为4257668条,每条数据采集12个项点(即柴油机12个气缸对应的12个缸头排温的温度),柴油机运行时间总共约1182个小时。
12个缸头排温的温度数据变化趋势,如
计算每两个气缸之间的温度差异,构建12 × 12的差异矩阵。差异矩阵里面的数值即12个缸彼此相互之间在同一时间点的差值,差异矩阵的密度图,如
差异矩阵的上半角矩阵的所有数值对应的频次分析,如
根据上述计算得到的差异矩阵,可以绘制差异矩阵的箱线图,如
使用5.4的公式分别计算IQR/Q1/Q3以及上限/下限数据,如下所示:
Q1 = −13.40
Q3 = 0.50
IQR = Q3 − Q1 = 13.90
下限(whis = 1.5) = Q1 − 1.5 * IQR = −34.25
上限(whis = 1.5)= Q3 + 1.5 * IQR = 21.35
下限(whis = 3.0) = Q1 − 3.0 * IQR = −51.10
上限(whis = 3.0) = Q3 + 3.0 * IQR = 42.20
针对柴油机气缸的缸头排温数据,对于差异值在[21.35, 42.20]和[−51.10, −34.25]的异常值(即whis = 1.5与whis = 3.0的计算值域区间),一般先建议注意观察使用。但对于差异值超过上限42.20 (whis = 3.0)或者低于下限−51.10 (whis = 3.0)的异常值,需要过滤出具体出现异常数据的气缸,对其进行维修处理。
对数据明细进行筛选排查可以看出,缸头排温1与缸头排温11温度差异明显过大,经与柴油机研发和维修专家沟通,建议这种情况应该对这两个气缸的喷油器进行对调之后进一步观察,或者同时对这两个气缸的喷油器进行更换处理;如果问题继续存在,可能需要进行更换这两个气缸对应的喷油泵。
十一号机车数据采集时间段也是2024年6月1日到2024年7月1日,数据量一共为5092490条,柴油机运行时间总共约1414个小时。由于数据采集样例和数据变化整体趋势和八号机车相似,故这里省略,直接对十一号机车进行差异分析和箱线图计算。
同样计算每两个气缸之间的温度差异,构建12 × 12的差异矩阵。差异矩阵里面的数值即12个缸彼此相互之间在同一时间点的差值,差异矩阵的密度图,如
差异矩阵的上半角矩阵的所有数值对应的频次分析,如
根据上述计算得到的差异矩阵,可以绘制差异矩阵的箱线图,如
使用5.4的公式分别计算IQR/Q1/Q3以及上限/下限数据,如下所示:
Q1 = −20.2
Q3 = 8.8
IQR = Q3 − Q1 = 29.0
下限(whis = 1.5) = Q1 − 1.5 * IQR = −63.7
上限(whis = 1.5) = Q3 + 1.5 * IQR = 52.3
下限(whis = 3.0) = Q1 − 3.0 * IQR = −107.2
上限(whis = 3.0) = Q3 + 3.0 * IQR = 95.8
针对柴油机气缸的缸头排温数据,对于差异值在[52.3, 95.8]和[−107.2, −63.7]的这种潜在异常值(即whis = 1.5与whis = 3.0的计算值域区间),一般先建议注意观察使用。但对于差异值超过上限95.8 (whis = 3.0)或者低于下限−107.2 (whis = 3.0)的异常值,需要过滤出具体出现异常数据的气缸,对其进行维修处理。
通过对明细数据进行筛选可以看出,缸头排温4与缸头排温10温度差异明显过大,与售后维修领域的专家沟通,这种情况同样可以先对这两个气缸的喷油器进行对调之后进一步观察,或者同时对这两个气缸的喷油器进行更换处理;如果问题继续存在,可能需要进行更换这两个气缸对应的喷油泵。
为了验证方法的鲁棒性与通用性,另选了十四号机车的运行数据。选择数据的时间段也是2024年6月1日到2024年7月1日,数据采样频率同样是每秒钟一条数据,数据量一共为5197385条,柴油机总共运行时间约为1443个小时。
同样,计算十四号机车12个气缸彼此之间的温度差异,构建12 × 12的差异矩阵。差异矩阵的密度图,如
差异矩阵的上半角矩阵的所有数值对应的频次分析,如
根据上述计算得到的差异矩阵,可以绘制差异矩阵的箱线图,如
使用5.4的公式分别计算IQR/Q1/Q3以及上限/下限数据,如下所示:
Q1 = −14.1
Q3 = 10.80
IQR = Q3 − Q1 = 24.9
下限(whis = 1.5) = Q1 − 1.5 * IQR = −51.45
上限(whis = 1.5) = Q3 + 1.5 * IQR = 48.15
下限(whis = 3.0) = Q1 − 3.0 * IQR = −88.8
上限(whis = 3.0) = Q3 + 3.0 * IQR = 85.5
通过对十四号柴油机气缸的缸头排温数据筛选,发现仅有460719条位于[48.15, 85.5]和[−51.45, −60.35]的异常值(即whis = 1.5与whis = 3.0的计算值域区间),对于这些异常数据,先注意观察使用即可,对数据进行检查发现,缸头排温8的温度数据与缸头排温12的温度数据差异有些过大,但是还没有到报警级别。但对于差异值超过上限85.50 (whis = 3.0)或者低于下限−88.8 (whis = 3.0)的异常值,没有筛选异常数据,即目前十四号机车没有需要检修的气缸。
最后选取十六号机车的运行数据。选择数据的时间段也是2024年6月1日到2024年7月1日,数据采样频率同样是每秒钟一条数据,数据量一共为5723742条,柴油机总共运行时间约为1589个小时。
同样,计算十六号机车每两个气缸之间的温度差异,构建12 × 12的差异矩阵。差异矩阵的密度图,如
差异矩阵的上半角矩阵的所有数值对应的频次分析,如
根据上述计算得到的差异矩阵,可以绘制差异矩阵的箱线图,如
使用5.4的公式分别计算IQR/Q1/Q3以及上限/下限数据,如下所示:
Q1 = −17.6
Q3 = 10.90
IQR = Q3 − Q1 = 28.5
下限(whis = 1.5) = Q1 − 1.5 * IQR = −60.35
上限(whis = 1.5) = Q3 + 1.5 * IQR = 53.65
下限(whis = 3.0) = Q1 − 3.0 * IQR = −103.10
上限(whis = 3.0) = Q3 + 3.0 * IQR = 96.40
通过对十六号柴油机气缸的缸头排温数据筛选,发现仅有82863条位于[53.65, 96.40]和[−103.10, −60.35]的异常值(即whis = 1.5与whis = 3.0的计算值域区间),对于这些异常数据,注意观察使用即可。通过数据可以看出,其中缸头排温7的温度数据与缸头排温10的温度数据差异有些过大,但是还没有到报警级别。但对于差异值超过上限96.40 (whis = 3.0)或者低于下限−103.10 (whis = 3.0)的异常值,没有筛选异常数据,即目前十六号机车没有需要检修的气缸。
对4个机车识别出的潜在异常值以及异常值总结如
数据记录(条数) |
潜在异常值(1.5 < whis < 3.0) |
异常值(whis > 3.0) |
是否检修 |
|
八号机车 |
4257668 |
1438734 |
94859 |
是 |
十一号机车 |
5092490 |
1278987 |
200 |
是 |
十四号机车 |
5197385 |
460719 |
0 |
否 |
十六号机车 |
5723742 |
82863 |
0 |
否 |
本研究通过对柴油机12个气缸的缸头排温进行差异分析,提出了一种基于差异矩阵 + 箱线图的故障诊断方法。该方法首先利用差异矩阵来计算12个气缸的缸头排温数据之间的相对差异,之后利用箱线图的异常值检测能力,自动识别出差异矩阵中的异常值,进而识别出柴油机对应气缸的潜在故障。该方法不仅适用于柴油机的故障检测,还可扩展至其他复杂系统(如风机、发电机、多气缸发动机)中进行状态监测。实验结果表明,该方法能够有效地识别和定位柴油机的潜在故障,并显著提高故障诊断的精确性和可靠性。通过在实际机车上的应用验证,差异矩阵 + 箱线图的异常检测方法在预防性维护以及优化运行等方面展现了显著的优势。
随着机车系统智能化和自动化程度的不断提升,基于大数据和深度学习的故障诊断方法将会发挥越来越重要的作用。未来的研究工作将继续优化差异分析 + 箱线图的算法模型,引入更多的自适应算法,提高系统的实时性和鲁棒性。同时,通过结合更多的传感器数据,实现多源信息融合,进一步提升机车PHM系统的诊断能力和维护效率。
总之,本研究为机车柴油机的智能故障诊断提供了一种新颖而有效的技术手段,不仅具有重要的理论意义,也具备广泛的实际应用前景。希望本研究能够为后续的研究工作提供参考和借鉴,为机车系统的安全稳定运行和智能化管理贡献力量。
国铁集团项目(N2021J052);中车重大项目(2023CKA340)。
*通讯作者。