1. 引言
面对传统的压实度检测方法无法进行实时监测,仅提供事后分析,造成评估的滞后的问题,智能压实技术通过融合计算机技术、精密传感技术和定位技术等先进技术[1],依据路基压实状态与压路机振动信号的关联,分析数据并转化为量化的智能压实指标,以最低成本实现路基的均匀压实[2]-[4]。但是,该技术在复杂的机械和土体条件下,相关性分析仍存在不足,难以精确控制压实质量。
近年来,人工智能技术与道路建设领域的紧密结合推动了机器学习,尤其是人工神经网络技术,在智能压实质量控制领域的广泛应用。Cao等[5]开发了一个包含压实次数、振动力、压路机重量和速度等因素在内的人工神经网络模型。相关研究表明,该模型的预测结果与现场实测数据高度吻合,其中压实次数是CMV值的主要影响因素。Pang等对比了线性回归与多种机器学习技术在建立CCV、CMV与路基压实度关系模型中的性能,发现机器学习方法的匹配度显著超过传统线性回归,且含水量是预测路基压实度的关键因素。邓志兴等通过构建一个考虑最大颗粒尺寸、颗粒级配、粗集料的针片状颗粒含量和洛杉矶磨耗值等因素的机器学习模型,成功预测了最优的压实振动频率。实验结果证实,这些模型在训练数据集上的拟合度均超过0.9,显示出强大的预测能力,其中ANN模型在预测最优振动频率方面表现最为出色。
鉴于现有路基压实技术及质量检测方法存在一定的局限性,本文利用现场试验数据,开发了用于评估路基压实质量的人工神经网络模型。该模型优化了压实度增量原则和输入变量,以增强预测精度并进行多指标的综合评估。通过比较现场实测数据与模型预测结果,验证了模型的准确性,进而实现了对粗粒土路基压实质量的动态评估。本文的发现不仅强化了智能压实技术的理论研究,也推动了其在工程实践中的应用,对提升道路施工的智能化和效率产生了积极的经济和社会效益。
2. 压实质量评价指标
依据《公路路基施工技术规范》(JTG/T 3610-2019)和《公路路基设计规范》(JTG D30-2015),针对粗粒土填料的路基压实质量控制,选择压实度作为主要的物理指标。振动轮的竖向振动加速度同样能够反映路基压实质量的变化。通过对振动加速度的时间历程和频谱特性进行分析,可以计算出用于智能压实质量控制的指标。本研究专注于探讨智能压实指标与路基压实状态之间的相关性,包括以下几个指标。
2.1. CMV指标
压实计值(Compaction Meter Value, CMV) [6]是出现最早、计算最简单、目前应用范围最广的指标之一,它代表加速度频谱曲线2次谐波幅值与基频幅值的比值,如式2-1所示。
(2-1)
式中:
、
分别为基频、2次谐波分量的幅值;C为常数,一般取300。
2.2. THD指标
当压路机振动加速度出现畸变时,频谱信号中通常最大可出现5次谐波分量,总谐波失真量(Total Harmonic Distortion, THD) [7]即考虑2次至5次谐波分量的影响,其计算如式2-2所示。
(2-2)
式中:
为振动加速度频谱曲线基频幅值;
为振动加速度频谱曲线i次谐波分量幅值C为常数,一般取300。
2.3. CCV指标
压实控制值(Compaction Control Value, CCV) [8],它综合考虑了整数次和分数次谐波的影响,更加充分反应振动加速度的畸变程度,如式2-3所示。
(2-3)
式中:
为振动加速度频谱曲线i次谐波分量幅值。
综上所述,本文中选取的粗粒土路基压实质量评价指标包括压实度,振动加速度上峰值Au,振动加速度频谱的基频及0.5次、1.5次、2次谐波分量幅值,CMV、THD、CCV,共五种指标。
3. 基于机器学习的路基压实质量评价方法
3.1. 机器学习方法概述
人工神经网络(Artificial Neural Networks, ANNs)是一种受到人类大脑神经元结构启发而设计的计算模型。它由多个神经元组成,每个神经元都与其他神经元通过权重连接,并通过这些连接来传递和处理信息。人工神经网络模型通常包含输入层、隐藏层和输出层,其中隐藏层可以有多层,典型的人工神经网络模型如图1所示。每个神经元接收来自上一层神经元的输入信号,对这些信号进行加权求和并经过激活函数处理,然后将结果传递给下一层神经元。通过不断调整连接权重,人工神经网络模型能够从输入数据中学习到复杂的非线性关系,并能够进行分类、回归、聚类等任务。
3.2. 人工神经网络模型建立
3.2.1. 数据准备
本章建立的粗粒土路基压实质量评价人工神经网络模型,其样本数据来源于路基振动压实现场试验数据100组。研究表明,考虑压实过程信息的人工神经网络模型具有较高的准确性[9]-[11]。每组数据内容包括初始压实度K0、松铺厚度H、激振力Fn、激振频率f、CMV、THD、2次谐波分量A2Ω、加速度上峰值Au、CCV和完成压实度Kn。
Figure 1. Typical artificial neural network model
图1. 典型人工神经网络模型
路基压实质量的预测的人工神经网络模型基本逻辑如图2所示。路基初始状态指路基初始压实度,工艺参数此处主要指路基松铺厚度,机械参数包括振动压路机激振力、激振频率,即输入层共包含4个节点。碾压完成的路基压实状态指完成后路基压实度,即输出层仅包含1个节点。因此,典型的数据形式为(K0, H, Fn, f, Kn)。由于输入与输出参数本身即为数字形式,无需进行数据的特征选择与数据编码,将100 × 5个数据存储在CSV文件中,待模型调用。
机器学习的样本分为训练样本(Training Samples)、验证样本(Validation Samples)和测试样本(Test Samples),其中训练样本和验证样本的合集称为开发集,如图3所示。训练样本是机器学习算法用来学习模型的数据
Figure 2. Basic logic of artificial neural network model
图2. 人工神经网络模型基本逻辑
Figure 3. Partition of sample database
图3. 样本数据库划分
集,这些数据包含了输入特征和对应的标签或目标值,使其能够学习输入与输出之间的关系。验证样本用于调整模型的超参数或进行模型选择。测试样本用于评估训练好的模型在未见过的数据上的性能。测试样本与训练样本和验证样本是相互独立的,用于评估模型的泛化能力和预测性能。
本文中随机分配了80%的现场采集数据用于构建开发集,而将剩余的20%作为测试集。在开发集的处理上,本节实施了K折交叉验证策略,该策略涉及将完整数据划分为K个部分,每个部分轮流作为验证集,其余则构成训练集。通过这种方式,每个数据子集均有机会用于模型的验证和训练,确保了评估的全面性。经过K轮的训练和验证后,通过计算模型性能评估的平均值,来作为模型性能的最终衡量。具体到本节,采用了5折交叉验证,如图4展示。
Figure 4. 5-fold cross-validation
图4. 5折交叉验证
3.2.2. 超参数优化
超参数,如隐藏层的数量、节点数、激活函数等,是在模型训练之前预设的,而非通过训练过程自动学习的参数。这些参数的选择对模型的表现和泛化能力起着决定性作用。如图5所示,Optuna主要采用Tree-structured Parzen Estimator (TPE)算法来构建和更新超参数搜索空间的概率模型[12]。本文将应用Optuna库,通过启发式算法来寻找最佳的超参数组合。
隐藏层的层数及各层神经元数量直接影响着模型的学习能力,因此在选择隐藏层数量和神经元数量时,需要权衡模型的表示能力、过拟合风险等因素。
文献表明,对于不太复杂的智能压实质量预测及质量控制人工神经网络模型,隐藏层数量一般不大于3 [13]。常见的隐藏层神经元数量确定方式如下所示,可以初步确定本节建立的人工神经网络模型的隐藏层节点数应为5~15个,后续进一步优化。
[14] (3-1)
[15] (3-2)
式中:
为隐藏层神经元数量;
为输入层神经元数量;
为输出层神经元数量;a为1~10之间的常数。
Figure 5. Visualization of Optuma hyperparameter optimization
图5. Optuma超参数优化的可视化
激活函数能为神经网络的隐藏层引入非线性特性。这种非线性特性是深度神经网络能够拟合复杂函数关系的关键所在。对于回归问题,常用的激活函数包括ReLU (Rectified Linear Unit) [16]、Sigmoid函数[17] 和Tanh函数[18],其定义分别如式3-3、式3-4和式3-5所示。
(3-3)
ReLU函数计算简单,能够加速模型的收敛和训练速度。然而,ReLU函数可能会导致神经元死亡(Dead Neurons)问题,从而导致相关的权重无法更新,这可能会影响模型的性能。
(3-4)
Sigmoid激活函数因其导数的连续性而提供了稳定的梯度更新。然而,在深层神经网络的应用中,Sigmoid函数可能会引起梯度的消失或激增现象,这些情况会削弱模型训练的效率。
(3-5)
Tanh函数是双曲正切函数,更有利于模型的收敛。它的输出范围在−1到1之间,对于零中心化的数据有更好的处理效果。但与Sigmoid函数类似,Tanh函数也存在梯度消失或梯度爆炸的可能性。
同样采用Optuna库超参数优化方法,从上述三个激活函数中优化最适合本节人工神经网络模型的激活函数。
在机器学习,损失函数(Loss Function)不仅用于评价模型训练阶段的表现,还充当优化过程的目标,指导模型通过参数调整来减少预测误差。对于回归任务,典型的损失函数有均方误差(MSE)、平均绝对误差(MAE)和对数损失等,它们的具体计算方式在公式3-6、3-7和3-8中有详细说明。
(3-6)
(3-7)
(3-8)
式中:
为第i组数据的预测值,由人工神经网络模型输出;
为第i组数据的真实值。
本节将压实度增量法则与MSE损失函数结合,以评估人工神经网络模型的性能。在路基压实过程中,理论上路基压实度不会随碾压遍数增加而减小,即
。将压实度的增加值定义为:
(3-9)
显然模型预测值与第一个特征值(初始压实度)的差值应为非负值,通过增加约束惩罚项(Constraint Penalty,CP)的方式修正损失函数,即当
时,则惩罚项为正值;当
时,惩罚项为0。修正后的损失函数为:
(3-10)
综上所述,本文建立的人工神经网络结构如图6所示。
Figure 6. Artificial neural network model for compacting quality evaluation
图6. 用于压实质量评价的人工神经网络模型
3.2.3. 人工神经网络模型训练
本章建立人工神经网络模型的流程如图7所示。
利用Optuna进行超参数调优后,确定了模型的最佳配置:隐藏层数为1,该层含有10个神经元,使用Tanh作为激活函数,dropout率为0.2,学习率为0.15,批大小为20。如图8展示的损失函数曲线所示,随着训练迭代的增加,损失值逐渐降低并趋于稳定在30左右,这反映出所构建的人工神经网络在开发数据集上展现出良好的稳定性。
在测试集上对模型进行测试,将预测的压实度与实测压实度进行对比,以增加4个参数后的最优模型为例,结果如图9所示。压实度预测值–实测值的MSE为1.23离散性较小。同时,模型的MAE为0.92,压实质量评价模型的可靠性较高,表明人工神经网络准确性较高。
Figure 7. Flow chart of artificial neural network establishment
图7. 人工神经网络模型流程图
Figure 8. Loss function curve of optimal model
图8. 最优模型的损失函数曲线
Figure 9. Comparison between predicted compactness and measured value
图9. 压实度预测与实测值对比
对比不同模型在增加输入参数后的表现,如图10所示。随着输入参数的增加,模型的测试误差,包括均方误差(MSE)和平均绝对误差(MAE),显著减少并逐渐稳定。具体来说,当引入一个额外的输入参数时,MAE和MSE分别从原始模型的1.73和1.92降至0.92和1.23。继续增加输入参数数量,MAE和MSE继续下降,MAE在增加到四个参数时达到最低点0.63,MSE在增加到五个参数时达到最低点0.79,但MSE的减少幅度仅为0.15%,降至0.79。
在实际应用中,除了考虑MSE和MAE,还必须考虑最大偏差对压实质量评估结果的影响,以限制误差的上限。各模型的最大偏差随着输入参数数量的增加而波动性下降。原始模型的最大偏差为3.48%,但在增加一个输入参数后,最大偏差上升至3.98%。这可能是由于现场试验中,单次碾压只进行了一次压实度检测,而该检测对应了20个不同的CMV测量点,导致仅将CMV作为神经网络模型输入时,现场数据的匹配度不高,从而产生了较大的偏差。当输入参数数量增至五个时,模型的最大偏差降至1.69%,而在增加四个参数时,最大偏差为1.81%,两者之间的差异相对较小。在综合考虑模型预测的准确性和计算效率后,包含四个参数(2次谐波分量、CMV、加速度上峰值和THD)的综合评价模型被认定为评估粗粒土路基压实质量的最佳模型。
Figure 10. Comparison of performance across different parameter models
图10. 不同参数模型性能的对比
4. 结论
本文通过现场试验中路基压实的100组数据,综合考虑压实度增量法则,结合机器学习,通过逐个增加压实质量评价优选指标作为输入参数,逐步优化人工神经网络模型性能,进一步提高模型预测的准确性,进而对路基压实质量进行评估,主要得到以下结论:
1) 构建了基于压实度增量法则的人工神经网络模型,用于预测粗粒土路基的压实质量,基于Optuna超参数优化方法,确定了模型的最优超参数组合为:隐藏层数为1,该层含有10个神经元,使用Tanh作为激活函数,dropout率为0.2,学习率为0.15,批大小为20。
2) 通过逐个增加优选的粗粒土压实质量评价指标作为输入参数,模型的预测精度与实际测量值之间的总体差异及其最大偏差均呈现出递减趋势,并逐步达到稳定。当参数增加个数为4时,平均绝对误差(MAE)为最小值0.63;当参数增加个数为5时,均方误差(MSE)为最小值0.79,模型最大偏差为最小值1.69%。综合考虑计算效率及模型准确性,选择四参数综合评价模型(2次谐波分量、CMV、加速度上峰值和THD)为粗粒土路基压实质量评价的最优模型。
NOTES
*通讯作者。