本文以线性回归理论为基础,运用MATLAB数学软件进行建模,针对环境监测数据处理中标准曲线法的求解问题进行探究。该建模方法所求得标准曲线的线性回归方程较Excel建模方法误差小,更为准确,可提高工作效率,在科研工作中可以得到一定应用。 This thesis, using linear regression theory and MATLAB mathematical software, explores the solution of the standard curve in the processing of environmental monitoring data. Compared with the Excel modeling method, this modeling method for solving the linear regression equation of standard curve, can make it’s error smaller and make it more accurate and simple to operate, and can improve the work efficiency. It can be fully used in the part of the chemical work.
孙嘉良
华北水利水电大学数学与统计学院,河南 郑州
收稿日期:2017年7月22日;录用日期:2017年8月11日;发布日期:2017年8月17日
本文以线性回归理论为基础,运用MATLAB数学软件进行建模,针对环境监测数据处理中标准曲线法的求解问题进行探究。该建模方法所求得标准曲线的线性回归方程较Excel建模方法误差小,更为准确,可提高工作效率,在科研工作中可以得到一定应用。
关键词 :环境监测,标准曲线,线性回归,MATLAB
Copyright © 2017 by author and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
对于环境监测数据处理时求解标准曲线问题,其目的是利用得到的标准曲线计算待测物质的含量,以求精确评价所测水体环境或者采取合适的水处理工艺。
对此问题目前化学工作者运用基于Excel程序进行求解,如白云做过c++程序求解的探究 [
线性回归利用线性回归方程的最小平方函数,对自变量和因变量之间的关系进行建模。国家规定的标准曲线做法是测定已知待测物质含量的标准试剂的吸光度值,得到一些离散点,求解通过这些点的一条直线。
由光吸收基本定律可知当实验条件满足要求时,待测物质的含量与吸光度呈线性关系,因而线性回归可运用于标准曲线求解。二者满足线性关系的前提下,影响吸光度值的条件中仅物质含量一个变量,因此采用一元线性回归分析来进行二者关系的建模。本文以吸光度值 为自变量,待测物含量 为因变量,建立一元线性回归模型:
步骤一:以国家规定的标准溶液浓度系列作为矩阵,实验得到对应的吸光度值矩阵,即
假定矩阵
步骤二:对于准备好的数学模型,将其运用到MATLAB软件的操作当中,编程调用MATLAB中的regress函数作一元线性回归:
返回线性回归方程中系数向量
步骤三:进行显著性检验和误差分析。通过得到的显著性检验相关参数,与临界值比较,采用残差进行误差分析,残差是衡量不确定性的指标,残差大小可以衡量预测的准确性,残差越大表示预测越不准确,残差与数据本身的分布特性和回归方程的选择有关。
其中
以“紫外分光光度法”测总氮含量中标准曲线求解为例,在满足定量分析要点的基础上,计算出标准试剂的浓度和扣除空白后对应的校正吸光度值(以下直接称吸光度值),得到标准溶液的总氮含量(Y)和吸光度值(X),如下表1:
构造出表中对应的线性回归矩阵算法如下:
MATLAB运行结果(表2~4,图1)
以上即利用MATLAB数学软件求得的结果及各统计参数,由表2可知求得回归方程(标准曲线方程)为
显著性检验
我们将原假设与对立假设分别为
1) 由表4检验p值为2.6847e−10,远小于0.01,可知显著性水平
2) 对于F统计量的观测值与临界值
与Excel建模方法 [
将案例一的数据运用Excel建模方法最终得到线性回归方程为:
X | 0.000 | 0.048 | 0.208 | 0.304 | 0.506 | 0.716 |
---|---|---|---|---|---|---|
Y (mg) | 0.00 | 0.005 | 0.02 | 0.03 | 0.05 | 0.07 |
表1. 总氮标准试剂浓度与校正吸光度值
系数的估计值 | 估计值的95%置信下限 | 估计值的95%置信上限 |
---|---|---|
−8.1764e−05 | −8.9099e−04 | 7.2746e−04 |
0.0989 | 0.0971 | 0.1006 |
表2. 系数的估计值与其置信上下限
Y的真实值 | Y的估计值 | 残差 | 残差的95%置信下限 | 残差的95%置信上限 |
---|---|---|---|---|
0 | −8.1764e−05 | 8.1764e−05 | −0.0011 | 0.0013 |
0.0050 | 0.0047 | 3.3613e−04 | −8.1348e−04 | 0.0015 |
0.0200 | 0.0205 | −4.8266e−04 | −0.0017 | 7.0416e−04 |
0.0300 | 0.0300 | 2.6060e−05 | −0.0013 | 0.0014 |
0.0500 | 0.0499 | 5.4836e−05 | −0.0013 | 0.0014 |
0.0500 | −8.1764e−05 | 8.1764e−05 | −0.0011 | 0.0013 |
0.0700 | 0.0047 | 3.3613e−04 | −8.1348e−04 | 0.0015 |
0.0800 | 0.0205 | −4.8266e−04 | −0.0017 | 7.0416e−04 |
表3. Y的真实值对应的估计值、残差及95%置信区间
F统计量观测值 | 检验的p值 | 残差的均值 | R2 |
---|---|---|---|
2.1862e+04 | 2.6847e−10 | 0 | 0.9998 |
表4. F统计量观测值、p值、残差均值及R2
图1. 总氮的标准曲线拟合图
归方程的残差的均值(表4)在同样的精确度下为0,说明MATLAB建模较Excel建模的误差小,准确度高。
下面以硝氮含量测定实验数据对所建立的模型进行检验,吸光度值X的数据如标准试剂中硝氮的含量Y下表5:
MATLAB程序运行结果:(表6~8,图2)
由表6,回归方程(标准曲线方程)为
显著性检验
由表8得出p值为2.7987e−09远远小于0.01,F统计量的观测值为
与Excel建模方法 [
将案例二的数据运用Excel建模方法最终得到线性回归方程为:
X | 0.000 | 0.058 | 0.124 | 0.245 | 0.365 | 0.487 |
---|---|---|---|---|---|---|
Y (μg) | 0.000 | 12.50 | 25.00 | 50.00 | 75.00 | 100.00 |
表5. 硝氮标准试剂浓度与校正吸光度值
系数的估计值 | 估计值的95%置信下限 | 估计值的95%置信上限 |
---|---|---|
0.0419 | −0.6820 | 0.7658 |
205.0419 | 202.3961 | 207.6876 |
表6. 系数的估计值与其置信上下限
Y的真实值 | Y的估计值 | 残差 | 残差的95%置信下限 | 残差的95%置信下限 |
---|---|---|---|---|
0 | 0.0419 | −0.0419 | −1.0137 | 0.9298 |
12.5 | 11.9343 | 0.5657 | −0.0053 | 1.1366 |
25 | 25.4671 | −0.4671 | −1.3262 | 0.3920 |
50 | 50.2772 | −0.2772 | −1.3570 | 0.8027 |
75 | 74.8822 | 0.1178 | −0.9415 | 1.1771 |
100 | 99.8973 | 0.1027 | −0.7010 | 0.9064 |
表7. Y的真实值对应的估计值、残差及95%置信区间
F统计量的观测值 | 检验的p值 | 残差的均值 | R2 |
---|---|---|---|
4.6299e+04 | 2.7987e−09 | −1.38778e−17 | 0.9999 |
表8. F统计量观测值、p值、残差均值及R2
图2. 硝氮的标准曲线拟合图
结果分析
两个案例基于不同的化学实验,测定的是不同的物质,标准物质的含量、吸光度值也不同,通过最终的实验结果可以看出,本文建立的模型可以适用于不同要求标准曲线方程的求解,且通过与Excel建模方法对比,可知MATLAB建模的误差较小,得到的回归方程准确度更高。
对于标准曲线的求解问题,一直未有基于MATLAB的线性回归分析方法。本文通过探索MATLAB建模实现线性回归,可快速的得到物质含量与吸光度值的标准曲线方程,同时和Excel建模对比,减小了误差,可以得到更准确的待测物质含量,从而得对水环境质量做出更为准确的评估。
孙嘉良. MATLAB建模实现线性回归处理环境监测数据的探索及与EXCEL建模的对比Exploration to Achieve by MATLAB Modeling Linear Regression Processing, Processing Environmental Monitoring Data and Comparison with Excel Modeling[J]. 应用数学进展, 2017, 06(05): 692-697. http://dx.doi.org/10.12677/AAM.2017.65082