TCN Deep Learning Model and Fault Detection Based on Integrating KAN Transformer in Photovoltaic Operation and Maintenance
Photovoltaic (PV) power generation, as a vital component of clean energy, plays a significant role in integrating into the power system, enhancing energy utilization efficiency, and reducing environmental pollution. However, the volatility and uncertainty of photovoltaic power generation pose challenges to the stable operation of the power grid. This study addresses the forecasting issue of photovoltaic power generation in the Gansu region’s power system by proposing an innovative deep learning model that integrates the advantages of Kolmogorov-Arnold Networks (KAN), Transformers, and Temporal Convolutional Networks (TCN) to improve forecasting accuracy. Considering the high-dimensional and nonlinear characteristics of photovoltaic power generation data, KAN layers are introduced to extract complex data patterns. Transformer layers effectively capture long-range dependencies in time series through self-attention mechanisms. TCN layers further enhance the model’s ability to capture local temporal features using dilated convolution techniques. To address the imbalance in the dataset, this study employs the SMOTE technique for data preprocessing, enhancing the model’s recognition capability for minority classes. During model training, the mean squared error (MSE) loss function is used as the optimization objective to minimize prediction errors. Moreover, this study not only focuses on forecasting accuracy but also applies the model to photovoltaic power generation fault monitoring, achieving early identification and warning of faults through real-time monitoring and analysis of operational data. Experimental results show that the proposed model performs excellently in photovoltaic power generation forecasting tasks, with higher prediction accuracy and robustness compared to existing methods. Additionally, through the application of fault monitoring, the model’s practical value in actual power system operations is demonstrated. The outcomes of this study provide new perspectives and technical support for the forecasting and operational management of photovoltaic power generation, which is of great significance for promoting the efficient use of renewable energy.
Photovoltaic Power Generation Forecasting
甘肃省作为我国重要的能源基地,特别是在太阳能发电领域,近年来取得了显著的发展。根据2024年6月13日的资料,甘肃省5月份光伏发电量达到32.28亿千瓦时,同比增长75.35%,占发电总量的18.32%。截至5月底,全省发电装机容量为9462.62万千瓦,其中太阳能装机容量为2744.02万千瓦,同比增长67.35%
甘肃省在新能源发展上具有得天独厚的优势,风能和光能资源有效储量分别位居全国第五和第三,具备基地化、规模化、一体化开发的优越条件。此外,甘肃省在“十四五”期间将加快推进风电基地建设和持续扩大光伏发电规模,特别是在沙漠、戈壁、荒漠地区开展规模化建设,实现太阳能发电与荒漠化治理、生态修复、农牧业融合发展
随着可再生能源的迅速发展,光伏发电作为其中的重要组成部分,在电力系统中扮演着越来越重要的角色。甘肃凭借其丰富的太阳能资源,已成为光伏发电潜力巨大的地区之一。然而,光伏发电的间歇性和不稳定性对电网的稳定运行提出了挑战,如何准确预测光伏发电量对甘肃电力系统的优化调度、负荷平衡和能源管理至关重要
近年来,深度学习在各类时序数据处理任务中展现了强大的能力,尤其是在复杂、高维数据的建模和分类任务上。传统的神经网络,如卷积神经网络(CNN)和循环神经网络(RNN),已经被广泛应用于时序数据处理。虽然CNN在图像处理和时序数据的局部特征提取方面表现出色,但其难以捕捉长程依赖关系。此外,CNN对高维数据的处理能力也有限,难以有效处理复杂的多维时序数据
循环神经网络(RNN)及其变体(如LSTM、GRU)擅长处理时序数据中的时间依赖性,然而,其在捕捉长程依赖关系时存在梯度消失或爆炸的问题。尽管LSTM和GRU通过门控机制部分缓解了这些问题,但它们的训练效率较低,并且在处理长序列时性能会下降
一些研究者尝试将CNN和RNN结合,以捕捉局部和全局的时序模式。然而,这类混合模型在处理高维数据和复杂时序依赖关系时,仍然面临计算复杂度和模型效率的挑战。为了应对这一挑战,本研究提出了一种融合了Kolmogorov-Arnold Networks (KAN)、Transformer和时间卷积网络(TCN)的深度学习模型。KAN通过函数分解,将复杂的高维时序数据映射到低维空间,从而降低数据的复杂度,并为后续的Transformer和TCN提供更有效的特征表示;Transformer通过自注意力机制捕捉全局依赖关系,而TCN则通过卷积操作捕捉局部特征。两者结合能够有效处理数据中的全局和同步模式。TCN的并行处理能力和Transformer的自注意力机制使得该融合模型在处理长序列时具备高效计算能力,同时能够捕捉重要的长程依赖关系。将Kolmogorov-Arnold Networks (KAN)、Transformer和时间卷积网络(TCN)进行融合,是解决复杂时序分类任务的一种有效方法。相比传统的神经网络模型,这种融合策略结合了KAN在高维数据处理上的优势、Transformer在长程依赖关系捕捉上的优势以及TCN在局部特征提取和高效计算上的优势
考虑到光伏发电量受到多种因素的影响,如气象条件(太阳辐射、温度、湿度等)、地理位置、时间特征等。在进行光伏发电量预测前,特征选择是数据处理的关键步骤,它可以有效提高模型的预测性能,减少计算复杂度,并防止过拟合。我们在此采用了Synthetic Minority Over-sampling Technique (SMOTE)进行数据预处理,SMOTE通过生成合成样本来平衡各类别的比例,从而提高模型对少数类别的识别能力。在模型训练阶段,我们采用了均方误差(Mean Squared Error, MSE)作为损失函数来衡量预测值与实际观测值之间的差异。MSE损失函数的优化有助于模型学习到更为精确的预测参数
此外,本研究还扩展了模型的应用范围,将其用于光伏发电故障监测。通过对光伏系统运行数据的实时监控和分析,模型能够及时识别并预警潜在的故障,为电力系统的稳定运行提供保障。
总之,本研究的光伏发电预测模型不仅提高了预测精度,还通过数据预处理和故障监测增强了模型的实用性和可靠性。这对于甘肃乃至更广泛地区的电力系统运维具有重要的参考价值。
本研究旨在建立一个神经网络模型,利用甘肃2024年1月1日至2024年6月30日期间太阳能发电量实际数据预测未来的发电量数据。
输入变量 |
样本量(个) |
平均值(MW) |
标准差(MW) |
最小值(MW) |
第25位百分数(MW) |
第50位百分数(MW) |
第75位百分数(MW) |
最大值(MW) |
17,362 |
3823.51 |
4862.57 |
0 |
8.78 |
214.17 |
8206.7 |
17467.3 |
本研究利用Python编程语言导入了必要的库来进行数据可视化。通过绘制预测光伏发电量随时间的变化趋势图,我们不仅直观地记录了光伏发电预测数据的动态行为,还揭示了它与太阳能发电量的潜在相关性。数据可视化的结果为模型的建立提供了直观的依据,有助于识别和分析太阳能发电量真实数据和预测数据之间的复杂关系,从而为太阳能发电量的预测和优化提供了科学依据。
模型的开发分为两个关键阶段:数据预处理和模型训练。预处理阶段的关键方面是涉及解决数据集中固有的不平衡问题。原始数据分布如
SMOTE过采样方法主要是为了解决数据集中类别不平衡的问题,尤其是少数类样本数量过少的情况。其基本原理是对少数类样本进行人工合成来增加样本数量。它通过在少数类样本与其最近邻的少数类样本之间进行线性插值来生成新的样本
(1)
其中 为生成的新样本, 是一个0到1之间的随机数。
SMOTE操作的结果如
在学习模型的开发过程中,利用特征选择的方法来限制输入变量的数量,从而减少计算量。在将数据输入机器学习系统时,特征选择可以消除不必要或重复的信息。输入更多的历史数据和输入变量可以较好地提取数据特征,但这样会增加模型的复杂性。因此,确定输入参数的数量至关重要。皮尔逊相关系数(PCC)用于评估影响光伏发电量关键输入特性。PCC经常用于衡量人工智能中特征选择的两个随机变量之间的线性依赖性。其计算形式如下:
(2)
公式(2)中 显示 与 有线性相关性,并且 。当 时, 与 呈正相关;当 时, 与 没有线性关;当 时, 与 呈负相关。在模型的学习阶段,根据大于或等于0.5的阈值确定可接受和排除的参数。特征选择的关键在于识别和选择与目标变量最相关的特征,以提高模型的性能和泛化能力。本模型中,特征选择通过命令行参数实现,使得模型训练可以灵活地适应不同的数据特征。
损失函数(Loss Function)用于衡量模型预测值与实际观测值差异的程度,指导模型训练过程中的参数优化。本文采用均方误差(Mean Squared Error, MSE)损失函数。它是一种连续且可微的函数,这一特性使得它在基于梯度的优化算法中表现出色。在随机梯度下降(Stochastic Gradient Descent, SGD)及其变体的优化方法中,MSE的梯度容易计算,从而能够有效地引导模型参数的更新,加速模型的训练收敛过程。
由于MSE对误差进行了平方运算,这使得较大的误差被赋予更高的权重。在实际应用中,对于那些偏离真实值较大的预测,MSE能够给予更强烈的惩罚,促使模型更加注重减少这些较大的偏差,从而提高整体的预测精度。通过对MSE的分析,可以深入理解模型的性能和行为,为模型的改进和优化提供有力的理论支持
(3)
其中
指实际值,
代表模型的预测输出值,
为样本容量。通过先进的优化算法(如高效的Adam优化器
KAN以Kolmogorov-Arnold表示定理为基石,其核心原理在于通过多层级的线性与非线性组合来近似复杂的函数形态。对于给定的输入向量 ,KAN的某一层可以精确地表述为:
(4)
在此表达式中,
和
是可学习的参数,
是输入
的变换。
是定理中的常数。而激活函数
通常采用诸如ReLU、Sigmoid或Tanh等非线性函数,为模型赋予强大的非线性拟合能力,使得模型能够捕捉到数据中丰富多样的复杂模式和非线性关系
Transformer是一种用于自然语言处理(NLP)和其他序列到序列(sequence-to-sequence)任务的深度学习模型架构,它在2017年由Vaswani等人首次提出。以下是Transformer的一些重要组成部分和特点:
自注意力机制(Self-Attention):这是Transformer的核心概念之一,它使模型能够同时考虑输入序列中的所有位置,而不是像循环神经网络(RNN)或卷积神经网络(CNN)一样逐步处理。自注意力机制允许模型根据输入序列中的不同部分来赋予不同的注意权重,从而更好地捕捉语义关系。
多头注意力(Multi-Head Attention):Transformer中的自注意力机制被扩展为多个注意力头,每个头可以学习不同的注意权重,以更好地捕捉不同类型的关系。多头注意力允许模型并行处理不同的信息子空间。
堆叠层(Stacked Layers):Transformer通常由多个相同的编码器和解码器层堆叠而成。这些堆叠的层有助于模型学习复杂的特征表示和语义。
位置编码(Positional Encoding):由于Transformer没有内置的序列位置信息,它需要额外的位置编码来表达输入序列中单词的位置顺序。
残差连接和层归一化(Residual Connections and Layer Normalization):这些技术有助于减轻训练过程中的梯度消失和爆炸问题,使模型更容易训练。
编码器和解码器:Transformer通常包括一个编码器用于处理输入序列和一个解码器用于生成输出序列,这使其适用于序列到序列的任务,如机器翻译等
Transformer模型的核心精髓在于其独特的自注意力机制(Self-Attention)。对于输入序列 ,其中每个元素 ,注意力机制的计算过程如下:
(5)
式中 , , 。 , , 均为可学习的参数矩阵,它们在训练过程中不断优化,以捕捉输入序列中元素之间的内在联系和依赖关系。而 是K的维度,通过除以 进行缩放,有助于稳定训练和优化注意力得分的分布。
通过这种自注意力机制,模型能够动态地为输入序列中的每个元素分配不同的权重,从而聚焦于对当前预测任务最为关键的部分,有效地捕捉长序列中的各种特征依赖关系。Transformer模型图如
TCN (Temporal Convolutional Network)充分利用一维卷积操作来处理时间序列数据。假设输入序列为 ,卷积核大小为k,步长为s,则卷积运算可以精准地表示为:
(6)
其中
是卷积核的权重,其数值决定了卷积操作对输入数据的滤波效果。通过调整卷积核的大小、数量和步长等参数,TCN能够有效地提取时间序列数据中的局部特征和短期模式
TCN结构图如
本文通过构建融合模型首先将输入的时间序列数据经由嵌入层转换为低维向量表示,从而降低数据的维度并提取初始的特征信息。随后,数据通过KAN层进行初步的特征提取和非线性变换,为后续的处理奠定基础。紧接着,利用Transformer的自注意力机制全面捕捉长序列中的依赖关系,充分获取全局上下文信息。最后,通过TCN层进一步精细地提取局部时间特征,从而实现对时间序列数据的全面且深入的理解和分析。
在研究中,本文所构建的深度学习模型吸取了卷积神经网络(CNN)和循环神经网络(RNN)的长处,巧妙地融合了Kolmogorov-Arnold Networks (KAN)、Transformer 和时间卷积网络(TCN)的独特优势,旨在高效处理时间序列数据并实现精准预测。
此处我们使用了2024年1月1日至2024年6月30日期间甘肃的历史光伏发电量数据(每日96个时段)在神经网络模型中进行训练,结果如
同时,在训练迭代时得到了如
本文在训练过程中还得到了如
从
总体而言,
为了建立故障检测方法,本文首先将一天的光伏发电量(光伏发电量的实际值和预测值)和此前七天的实际光伏发电量的相关性进行了计算,得到了
变量 |
S1 |
S2 |
S3 |
S4 |
S5 |
S6 |
S7 |
实际值 |
0.98 |
0.98 |
0.98 |
0.98 |
0.98 |
0.98 |
0.98 |
预测值 |
0.98 |
0.98 |
0.98 |
0.97 |
0.96 |
0.97 |
0.97 |
从
为了证明我们的模型的优良性和更好地对预测模型进行故障检测,本文又引入了ROC曲线和AUC值。ROC (Receiver Operating Characteristic)曲线用于评估分类模型在不同决策阈值下的表现。它通过描绘真正率(True Positive Rate, TPR)和假正率(False Positive Rate, FPR)的关系来衡量模型的性能。
真正率(TPR):即召回率,表示在所有实际为正类的样本中被正确预测为正类的比例,计算公式为:
(7)
其中TP (True Positive)是将正类预测为正类的样本数,FN (False Negative)是将正类预测为负类的样本数。
假正率(FPR):表示在所有实际为负类的样本中被错误预测为正类的比例,计算公式为:
(8)
其中FP (False Positive)是将负类预测为正类的样本数,TN (True Negative)是将负类预测为负类的样本数。
AUC (Area Under the Curve)是ROC曲线下的面积,表示模型区分正负样本能力的大小。AUC的值介于0.5到1之间,值越大表示模型的分类性能越好。AUC = 0.5表示模型的分类能力相当于随机猜测;AUC = 1表示模型的分类能力完美,即对正负类样本完全正确分类
AUC值的数学计算可以通过积分ROC曲线下的面积来实现。通常使用梯形规则(Trapezoidal Rule)近似计算AUC,即将ROC曲线分为多个小梯形,并求和各个梯形的面积。ROC曲线下的面积AUC可通过如下积分表示:
(9)
根据上式由光伏发电预测值计算得到ROC曲线和AUC值,如
本研究提出的深度学习模型,通过融合Kolmogorov-Arnold Networks (KAN)、Transformer和时间卷积网络(TCN)的技术优势,成功解决了光伏发电预测中的高维性和非线性问题,提高了预测精度。在技术应用层面,模型的创新之处在于其对时间序列长距离依赖关系的捕捉能力,以及对局部时间特征的强化,这为光伏发电数据的复杂模式识别提供了新的视角。在数据预处理上,本文采用SMOTE技术对数据集进行预处理,有效解决了不平衡问题,增强了模型对少数类别的识别能力,这在提高模型泛化能力方面起到了关键作用。对优化目标,本文使用均方误差(MSE)作为损失函数,确保了模型训练过程中预测误差的最小化,这为模型的精确度提供了量化的优化标准。就实际应用价值而言,模型不仅在光伏发电预测任务上表现出色,而且通过实时监控和分析运行数据,实现了故障的早期识别和预警,证明了其在实际电力系统运维中的实用价值。 在社会与环境影响方面,本文的研究成果对于提高能源利用效率、减少环境污染以及促进可再生能源的高效利用具有重要意义,可为电力系统的可持续发展提供良好的技术支持。尽管本文取得了有意义的研究成果,但光伏发电预测和故障监测领域仍存在进一步优化和研究的空间,未来的工作可以探索模型在不同环境条件下的适应性,以及与其他预测技术的集成应用。
本文由国网甘肃省电力公司科技项目“基于长周期运行的双边现货市场全链条智能技术支持及运维关键技术研究及应用”(522722240008)资助。