基于机器学习的路基压实质量评价研究
Research on Subgrade Compaction Quality Evaluation Based on Machine Learning
DOI: 10.12677/hjce.2024.1310220, PDF, HTML, XML,   
作者: 马世骏*, 殷 明, 徐学彬:济南城市建设集团有限公司,山东 济南;王育杰:山东大学齐鲁交通学院,山东 济南
关键词: 路基压实压实质量人工神经网络Subgrade Compaction Compaction Quality Evaluations Artificial Neural Network
摘要: 针对现有的智能压实技术应用于粗粒土填料时的适配性不足,以及在多变施工场景下压实度预测准确性不足的问题方面,本文成功开发了一种依据压实度的增量原则进行优化的人工神经网络模型。研究结果显示,通过将粗粒土压实质量的关键评价指标逐一加入模型,显著提升了模型的预测准确度,预测误差随着输入参数数量的增加而显著减少,并最终达到稳定状态。包含四个参数(2次谐波分量、CMV、加速度上峰值和THD)的综合评价模型,在粗粒土路基压实质量评估中表现最佳,其平均绝对误差(MAE)和均方误差(MSE)分别降至0.63和0.79,最大偏差控制在1.82%以内。这些改进确保了模型输出的压实度与现场实测值高度吻合,实现了对路基压实质量的高效、实时智能评估。
Abstract: In response to the insufficiency of adaptability of existing intelligent compaction technologies when applied to coarse-grained soil fillers, and the lack of accuracy in compaction degree prediction under variable construction scenarios, this paper successfully developed an artificial neural network model optimized based on the incremental principle of compaction degree. The research findings indicate that by incrementally incorporating key evaluation indicators of coarse-grained soil compaction quality into the model, the predictive accuracy of the model was significantly enhanced, with the prediction error markedly decreasing as the number of input parameters increased, eventually reaching a stable state. The comprehensive evaluation model, which includes four parameters (A, Au, CMV, THD), demonstrated the best performance in the assessment of compaction quality for coarse-grained soil subgrades, with the Mean Absolute Error (MAE) and Mean Squared Error (MSE) reduced to 0.63 and 0.79, respectively, and the maximum deviation controlled within 1.82%. These improvements ensure that the model's output of compaction degree closely matches the field-measured values, achieving efficient and real-time intelligent assessment of subgrade compaction quality.
文章引用:马世骏, 殷明, 徐学彬, 王育杰. 基于机器学习的路基压实质量评价研究[J]. 土木工程, 2024, 13(10): 2024-2034. https://doi.org/10.12677/hjce.2024.1310220

1. 引言

面对传统的压实度检测方法无法进行实时监测,仅提供事后分析,造成评估的滞后的问题,智能压实技术通过融合计算机技术、精密传感技术和定位技术等先进技术[1],依据路基压实状态与压路机振动信号的关联,分析数据并转化为量化的智能压实指标,以最低成本实现路基的均匀压实[2]-[4]。但是,该技术在复杂的机械和土体条件下,相关性分析仍存在不足,难以精确控制压实质量。

近年来,人工智能技术与道路建设领域的紧密结合推动了机器学习,尤其是人工神经网络技术,在智能压实质量控制领域的广泛应用。Cao等[5]开发了一个包含压实次数、振动力、压路机重量和速度等因素在内的人工神经网络模型。相关研究表明,该模型的预测结果与现场实测数据高度吻合,其中压实次数是CMV值的主要影响因素。Pang等对比了线性回归与多种机器学习技术在建立CCV、CMV与路基压实度关系模型中的性能,发现机器学习方法的匹配度显著超过传统线性回归,且含水量是预测路基压实度的关键因素。邓志兴等通过构建一个考虑最大颗粒尺寸、颗粒级配、粗集料的针片状颗粒含量和洛杉矶磨耗值等因素的机器学习模型,成功预测了最优的压实振动频率。实验结果证实,这些模型在训练数据集上的拟合度均超过0.9,显示出强大的预测能力,其中ANN模型在预测最优振动频率方面表现最为出色。

鉴于现有路基压实技术及质量检测方法存在一定的局限性,本文利用现场试验数据,开发了用于评估路基压实质量的人工神经网络模型。该模型优化了压实度增量原则和输入变量,以增强预测精度并进行多指标的综合评估。通过比较现场实测数据与模型预测结果,验证了模型的准确性,进而实现了对粗粒土路基压实质量的动态评估。本文的发现不仅强化了智能压实技术的理论研究,也推动了其在工程实践中的应用,对提升道路施工的智能化和效率产生了积极的经济和社会效益。

2. 压实质量评价指标

依据《公路路基施工技术规范》(JTG/T 3610-2019)和《公路路基设计规范》(JTG D30-2015),针对粗粒土填料的路基压实质量控制,选择压实度作为主要的物理指标。振动轮的竖向振动加速度同样能够反映路基压实质量的变化。通过对振动加速度的时间历程和频谱特性进行分析,可以计算出用于智能压实质量控制的指标。本研究专注于探讨智能压实指标与路基压实状态之间的相关性,包括以下几个指标。

2.1. CMV指标

压实计值(Compaction Meter Value, CMV) [6]是出现最早、计算最简单、目前应用范围最广的指标之一,它代表加速度频谱曲线2次谐波幅值与基频幅值的比值,如式2-1所示。

CMV=C A 2Ω A Ω (2-1)

式中: A Ω A 2Ω 分别为基频、2次谐波分量的幅值;C为常数,一般取300。

2.2. THD指标

当压路机振动加速度出现畸变时,频谱信号中通常最大可出现5次谐波分量,总谐波失真量(Total Harmonic Distortion, THD) [7]即考虑2次至5次谐波分量的影响,其计算如式2-2所示。

THD=C A 2Ω 2 + A 3Ω 2 + A 4Ω 2 + A 5Ω 2 A Ω (2-2)

式中: A Ω 为振动加速度频谱曲线基频幅值; A iΩ 为振动加速度频谱曲线i次谐波分量幅值C为常数,一般取300。

2.3. CCV指标

压实控制值(Compaction Control Value, CCV) [8],它综合考虑了整数次和分数次谐波的影响,更加充分反应振动加速度的畸变程度,如式2-3所示。

CCV= A 0.5Ω + A 1.5Ω + A 2Ω + A 2.5Ω + A 3Ω A 0.5Ω + A Ω ×100 (2-3)

式中: A iΩ 为振动加速度频谱曲线i次谐波分量幅值。

综上所述,本文中选取的粗粒土路基压实质量评价指标包括压实度,振动加速度上峰值Au,振动加速度频谱的基频及0.5次、1.5次、2次谐波分量幅值,CMV、THD、CCV,共五种指标。

3. 基于机器学习的路基压实质量评价方法

3.1. 机器学习方法概述

人工神经网络(Artificial Neural Networks, ANNs)是一种受到人类大脑神经元结构启发而设计的计算模型。它由多个神经元组成,每个神经元都与其他神经元通过权重连接,并通过这些连接来传递和处理信息。人工神经网络模型通常包含输入层、隐藏层和输出层,其中隐藏层可以有多层,典型的人工神经网络模型如图1所示。每个神经元接收来自上一层神经元的输入信号,对这些信号进行加权求和并经过激活函数处理,然后将结果传递给下一层神经元。通过不断调整连接权重,人工神经网络模型能够从输入数据中学习到复杂的非线性关系,并能够进行分类、回归、聚类等任务。

3.2. 人工神经网络模型建立

3.2.1. 数据准备

本章建立的粗粒土路基压实质量评价人工神经网络模型,其样本数据来源于路基振动压实现场试验数据100组。研究表明,考虑压实过程信息的人工神经网络模型具有较高的准确性[9]-[11]。每组数据内容包括初始压实度K0、松铺厚度H、激振力Fn、激振频率f、CMV、THD、2次谐波分量A、加速度上峰值Au、CCV和完成压实度Kn

Figure 1. Typical artificial neural network model

1. 典型人工神经网络模型

路基压实质量的预测的人工神经网络模型基本逻辑如图2所示。路基初始状态指路基初始压实度,工艺参数此处主要指路基松铺厚度,机械参数包括振动压路机激振力、激振频率,即输入层共包含4个节点。碾压完成的路基压实状态指完成后路基压实度,即输出层仅包含1个节点。因此,典型的数据形式为(K0, H, Fn, f, Kn)。由于输入与输出参数本身即为数字形式,无需进行数据的特征选择与数据编码,将100 × 5个数据存储在CSV文件中,待模型调用。

机器学习的样本分为训练样本(Training Samples)、验证样本(Validation Samples)和测试样本(Test Samples),其中训练样本和验证样本的合集称为开发集,如图3所示。训练样本是机器学习算法用来学习模型的数据

Figure 2. Basic logic of artificial neural network model

2. 人工神经网络模型基本逻辑

Figure 3. Partition of sample database

3. 样本数据库划分

集,这些数据包含了输入特征和对应的标签或目标值,使其能够学习输入与输出之间的关系。验证样本用于调整模型的超参数或进行模型选择。测试样本用于评估训练好的模型在未见过的数据上的性能。测试样本与训练样本和验证样本是相互独立的,用于评估模型的泛化能力和预测性能。

本文中随机分配了80%的现场采集数据用于构建开发集,而将剩余的20%作为测试集。在开发集的处理上,本节实施了K折交叉验证策略,该策略涉及将完整数据划分为K个部分,每个部分轮流作为验证集,其余则构成训练集。通过这种方式,每个数据子集均有机会用于模型的验证和训练,确保了评估的全面性。经过K轮的训练和验证后,通过计算模型性能评估的平均值,来作为模型性能的最终衡量。具体到本节,采用了5折交叉验证,如图4展示。

Figure 4. 5-fold cross-validation

4. 5折交叉验证

3.2.2. 超参数优化

超参数,如隐藏层的数量、节点数、激活函数等,是在模型训练之前预设的,而非通过训练过程自动学习的参数。这些参数的选择对模型的表现和泛化能力起着决定性作用。如图5所示,Optuna主要采用Tree-structured Parzen Estimator (TPE)算法来构建和更新超参数搜索空间的概率模型[12]。本文将应用Optuna库,通过启发式算法来寻找最佳的超参数组合。

隐藏层的层数及各层神经元数量直接影响着模型的学习能力,因此在选择隐藏层数量和神经元数量时,需要权衡模型的表示能力、过拟合风险等因素。

文献表明,对于不太复杂的智能压实质量预测及质量控制人工神经网络模型,隐藏层数量一般不大于3 [13]。常见的隐藏层神经元数量确定方式如下所示,可以初步确定本节建立的人工神经网络模型的隐藏层节点数应为5~15个,后续进一步优化。

n H = n I ( n O +2 )+1 [14] (3-1)

n H = n I + n O +a [15] (3-2)

式中: n H 为隐藏层神经元数量; n I 为输入层神经元数量; n O 为输出层神经元数量;a为1~10之间的常数。

Figure 5. Visualization of Optuma hyperparameter optimization

5. Optuma超参数优化的可视化

激活函数能为神经网络的隐藏层引入非线性特性。这种非线性特性是深度神经网络能够拟合复杂函数关系的关键所在。对于回归问题,常用的激活函数包括ReLU (Rectified Linear Unit) [16]、Sigmoid函数[17] 和Tanh函数[18],其定义分别如式3-3、式3-4和式3-5所示。

ReLU( x )=max( 0,x ) (3-3)

ReLU函数计算简单,能够加速模型的收敛和训练速度。然而,ReLU函数可能会导致神经元死亡(Dead Neurons)问题,从而导致相关的权重无法更新,这可能会影响模型的性能。

Sigmoid( x )= 1 1+ e x (3-4)

Sigmoid激活函数因其导数的连续性而提供了稳定的梯度更新。然而,在深层神经网络的应用中,Sigmoid函数可能会引起梯度的消失或激增现象,这些情况会削弱模型训练的效率。

Tanh= e x e x e x + e x (3-5)

Tanh函数是双曲正切函数,更有利于模型的收敛。它的输出范围在−1到1之间,对于零中心化的数据有更好的处理效果。但与Sigmoid函数类似,Tanh函数也存在梯度消失或梯度爆炸的可能性。

同样采用Optuna库超参数优化方法,从上述三个激活函数中优化最适合本节人工神经网络模型的激活函数。

在机器学习,损失函数(Loss Function)不仅用于评价模型训练阶段的表现,还充当优化过程的目标,指导模型通过参数调整来减少预测误差。对于回归任务,典型的损失函数有均方误差(MSE)、平均绝对误差(MAE)和对数损失等,它们的具体计算方式在公式3-6、3-7和3-8中有详细说明。

MSE= 1 n i=1 n ( y true i y pred i ) 2 (3-6)

MAE= 1 n i=1 n | y true i y pred i | (3-7)

logLoss= 1 n i=1 n [ y true i log( y pred i )+( 1 y true i )log( 1 y pred i ) ] (3-8)

式中: y pred i 为第i组数据的预测值,由人工神经网络模型输出;

y true i 为第i组数据的真实值。

本节将压实度增量法则与MSE损失函数结合,以评估人工神经网络模型的性能。在路基压实过程中,理论上路基压实度不会随碾压遍数增加而减小,即 K n+1 K n 0 。将压实度的增加值定义为:

ΔK= K n+1 K n (3-9)

显然模型预测值与第一个特征值(初始压实度)的差值应为非负值,通过增加约束惩罚项(Constraint Penalty,CP)的方式修正损失函数,即当 ΔK<0 时,则惩罚项为正值;当 ΔK0 时,惩罚项为0。修正后的损失函数为:

Loss TR =MSE+CP (3-10)

综上所述,本文建立的人工神经网络结构如图6所示。

Figure 6. Artificial neural network model for compacting quality evaluation

6. 用于压实质量评价的人工神经网络模型

3.2.3. 人工神经网络模型训练

本章建立人工神经网络模型的流程如图7所示。

利用Optuna进行超参数调优后,确定了模型的最佳配置:隐藏层数为1,该层含有10个神经元,使用Tanh作为激活函数,dropout率为0.2,学习率为0.15,批大小为20。如图8展示的损失函数曲线所示,随着训练迭代的增加,损失值逐渐降低并趋于稳定在30左右,这反映出所构建的人工神经网络在开发数据集上展现出良好的稳定性。

在测试集上对模型进行测试,将预测的压实度与实测压实度进行对比,以增加4个参数后的最优模型为例,结果如图9所示。压实度预测值–实测值的MSE为1.23离散性较小。同时,模型的MAE为0.92,压实质量评价模型的可靠性较高,表明人工神经网络准确性较高。

Figure 7. Flow chart of artificial neural network establishment

7. 人工神经网络模型流程图

Figure 8. Loss function curve of optimal model

8. 最优模型的损失函数曲线

Figure 9. Comparison between predicted compactness and measured value

9. 压实度预测与实测值对比

对比不同模型在增加输入参数后的表现,如图10所示。随着输入参数的增加,模型的测试误差,包括均方误差(MSE)和平均绝对误差(MAE),显著减少并逐渐稳定。具体来说,当引入一个额外的输入参数时,MAE和MSE分别从原始模型的1.73和1.92降至0.92和1.23。继续增加输入参数数量,MAE和MSE继续下降,MAE在增加到四个参数时达到最低点0.63,MSE在增加到五个参数时达到最低点0.79,但MSE的减少幅度仅为0.15%,降至0.79。

在实际应用中,除了考虑MSE和MAE,还必须考虑最大偏差对压实质量评估结果的影响,以限制误差的上限。各模型的最大偏差随着输入参数数量的增加而波动性下降。原始模型的最大偏差为3.48%,但在增加一个输入参数后,最大偏差上升至3.98%。这可能是由于现场试验中,单次碾压只进行了一次压实度检测,而该检测对应了20个不同的CMV测量点,导致仅将CMV作为神经网络模型输入时,现场数据的匹配度不高,从而产生了较大的偏差。当输入参数数量增至五个时,模型的最大偏差降至1.69%,而在增加四个参数时,最大偏差为1.81%,两者之间的差异相对较小。在综合考虑模型预测的准确性和计算效率后,包含四个参数(2次谐波分量、CMV、加速度上峰值和THD)的综合评价模型被认定为评估粗粒土路基压实质量的最佳模型。

Figure 10. Comparison of performance across different parameter models

10. 不同参数模型性能的对比

4. 结论

本文通过现场试验中路基压实的100组数据,综合考虑压实度增量法则,结合机器学习,通过逐个增加压实质量评价优选指标作为输入参数,逐步优化人工神经网络模型性能,进一步提高模型预测的准确性,进而对路基压实质量进行评估,主要得到以下结论:

1) 构建了基于压实度增量法则的人工神经网络模型,用于预测粗粒土路基的压实质量,基于Optuna超参数优化方法,确定了模型的最优超参数组合为:隐藏层数为1,该层含有10个神经元,使用Tanh作为激活函数,dropout率为0.2,学习率为0.15,批大小为20。

2) 通过逐个增加优选的粗粒土压实质量评价指标作为输入参数,模型的预测精度与实际测量值之间的总体差异及其最大偏差均呈现出递减趋势,并逐步达到稳定。当参数增加个数为4时,平均绝对误差(MAE)为最小值0.63;当参数增加个数为5时,均方误差(MSE)为最小值0.79,模型最大偏差为最小值1.69%。综合考虑计算效率及模型准确性,选择四参数综合评价模型(2次谐波分量、CMV、加速度上峰值和THD)为粗粒土路基压实质量评价的最优模型。

NOTES

*通讯作者。

参考文献

[1] 冯永乾, 江辉煌, 吴龙梁, 等. 填筑工程连续压实控制技术研究进展[J]. 铁道标准设计, 2020, 64(7): 50-58+63.
[2] 张月魁, 袁海文, 蔡树向, 等. 振动压路机压实度检测系统设计[J]. 测控技术, 2014, 33(4): 46-49+53.
[3] 徐光辉, 高辉, 雒泽华, 等. 连续与智能压实控制技术在高速铁路建设中的应用[J]. 筑路机械与施工机械化, 2017, 34(1): 30-34.
[4] 林国利, 陆永明, 程经纬. 连续压实管理系统的研究和应用优势[J]. 测绘通报, 2017(6): 114-117+121.
[5] Cao, L., Zhou, J., Li, T., Chen, F. and Dong, Z. (2021) Influence of Roller-Related Factors on Compaction Meter Value and Its Prediction Utilizing Artificial Neural Network. Construction and Building Materials, 268, Article 121078.
https://doi.org/10.1016/j.conbuildmat.2020.121078
[6] Adam, D. and Kopf, F. (2004) Operational Devices for Compaction Optimization and Quality Control (Continuous Compaction Control & Light Falling Weight Device). Automation in Construction, 89, 162-169.
[7] Forssblad, L. (1980) Compaction Meter on Vibrating Rollers for Improved Compaction Control. Proceedings of the International Conference on Compaction, 2, 541-546.
[8] Nohse, Y. and Kitano, M. (2002) Development of a New Type of Single Drum Vibratory Roller. Proceedings of the 14th International Conference on Information Technologies and Information Society for Terrain-Vehicle Systems, Vicksburg, 20-24.
[9] Fathi, A., Tirado, C., Rocha, S., Mazari, M. and Nazarian, S. (2021) A Machine-Learning Approach for Extracting Modulus of Compacted Unbound Aggregate Base and Subgrade Materials Using Intelligent Compaction Technology. Infrastructures, 6, Article 142.
https://doi.org/10.3390/infrastructures6100142
[10] Wang, X., Dong, X., Zhang, Z., Zhang, J., Ma, G. and Yang, X. (2022) Compaction Quality Evaluation of Subgrade Based on Soil Characteristics Assessment Using Machine Learning. Transportation Geotechnics, 32, Article 100703.
https://doi.org/10.1016/j.trgeo.2021.100703
[11] Tophel, A., Walker, J.P., Dutta, T.T. and Kodikara, J. (2022) Using a Novel Instrumented Roller to Estimate Soil Dry Density during Compaction. In: Lecture Notes in Civil Engineering, Springer, 538-546.
https://doi.org/10.1007/978-3-031-20241-4_38
[12] Akiba, T., Sano, S., Yanase, T., Ohta, T. and Koyama, M. (2019) Optuna. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, New York, 4-8 August 2019, 2623-2631.
https://doi.org/10.1145/3292500.3330701
[13] Xue, Z., Cao, W., Liu, S., Ren, F. and Wu, Q. (2021) Artificial Neural Network-Based Method for Real-Time Estimation of Compaction Quality of Hot Asphalt Mixes. Applied Sciences, 11, Article 7136.
https://doi.org/10.3390/app11157136
[14] 高大启. 有教师的线性基本函数前向三层神经网络结构研究[J]. 电路与系统学报, 1997, 2(3): 31-37.
[15] 王韬. 基于BP神经网络的供水管网爆管风险预测模型研究[D]: [硕士学位论文]. 重庆: 重庆大学, 2019.
[16] Boumiza, S. and Braham, R. (2023) In-Vehicle Network Intrusion Detection Using DNN with ReLU Activation Function. 2023 International Conference on Cyberworlds (CW), Sousse, 3-5 October 2023, 410-416.
https://doi.org/10.1109/cw58918.2023.00070
[17] Kaloev, M. and Krastev, G. (2021) Comparative Analysis of Activation Functions Used in the Hidden Layers of Deep Neural Networks. 2021 3rd International Congress on Human-Computer Interaction, Optimization and Robotic Applications, Ankara, 11-13 June 2021, 1-5.
https://doi.org/10.1109/hora52670.2021.9461312
[18] Chien, J. and Lu, T. (2015) Deep Recurrent Regularization Neural Network for Speech Recognition. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing, South Brisbane, 19-24 April 2015, 4560-4564.
https://doi.org/10.1109/icassp.2015.7178834

Baidu
map