Image Denoising Algorithm Based on Generalized Gaussian Mixture Model
Images are often disturbed by noise during acquisition and transmission, which can seriously affect the quality of images. Therefore, efficient image denoising methods have become an important research topic in the field of image processing. Accurate modeling of image noise is a key step to improve the performance of image denoising, and this paper proposes a low-rank matrix decomposition method based on the generalized Gaussian mixture model to address this problem. By assuming that the noise obeys a generalized Gaussian mixture distribution, the complex noise characteristics are accurately portrayed, and the main structural features of the data are captured by the low-rank matrix decomposition. To optimize the model parameters, an expectation maximization algorithm is used for iterative updating. Experiments on synthetic data and real image datasets show that the model outperforms other comparative models in this paper, indicating that the algorithm has some advantages in image denoising.
Generalized Gaussian Mixed Distribution
在图像的拍摄、采集、传输等过程中,不可避免地会引入不必要的信号,这些信号会影响图像的质量,并且在后续图像处理中产生相应的干扰,这些干扰信号称为噪声
目前,传统的图像去噪方法
图像去噪在图像处理中占有重要地位,许多去噪方法依赖于对噪声和图像信号的精确建模。高斯分布在建模噪声方面具有重要作用。Meng和La Torre开发了基于MoG的LRMF模型
广义高斯混合模型能够适应多种形状的噪声分布,提供比单一高斯模型和传统高斯混合模型更精确的噪声建模。1999年,Molina等人提出了将广义高斯分布用于图像去噪的应用,通过最大后验估计(MAP)方法进行噪声建模和去除
针对上述问题,本文假设噪声服从广义高斯混合分布,建立基于广义高斯混合模型的低秩矩阵分解模型。模型的参数采用EM算法进行迭代更新,在合成数据和真实图像数据上的大量实验证明了算法的有效性。
广义高斯分布在统计学中是一种参数化的连续概率分布,是高斯分布的扩展形式。广义高斯分布是一种灵活的概率模型,通过调整形状参数可以改变分布曲线的形状,从而描述出多种数据特性,如从尖峰到平坦,从轻尾到重尾。
广义高斯分布的模型参数有三个,均值 ,方差 和形状参数 ,它的概率密度函数通常表示为:
(1)
其中, 。
广义高斯混合模型是基于广义高斯分布的概率模型,通过将多个广义高斯分布加权组合,能够更灵活地拟合复杂数据的分布。广义高斯混合模型的分布为:
(2)
广义高斯混合模型(GGMM)相比单一广义高斯分布(GGD),拥有更强的灵活性。GGMM通过多个广义高斯分布的加权组合,能够建模多模态分布,捕捉数据中不同区域的多样化特性。相比之下,单一GGD仅适用于单峰分布,无法刻画复杂分布的局部变化和多模态特性。GGMM在数据拟合、精度提升和多样性描述方面显著优于单一GGD,是复杂分布建模中的更优选择。
低秩矩阵分解
给定一个矩阵 ,低秩矩阵分解是将它近似表示为两个低维矩阵 、 的乘积:
(3)
其中, 是分解矩阵的秩。在低秩矩阵分解中,分解矩阵的秩r决定了所保留的特征信息量。通过选择适当的r,可以在压缩数据维度的同时尽量保持原始矩阵的主要结构特征。
首先,利用GGMM对输入矩阵的噪声元素进行建模,从而获得对数似然优化目标;然后通过假设一个高维的潜变量,在EM框架下迭代求解。
考虑噪声部分(记为 ),每个元素 在低秩矩阵分解中的表达式可以写成:
(4)
用GGMM对原始数据中的未知噪声进行建模。因此,每个 服从一个GGMM分布 定义为:
(5)
则式(5)中的每个 服从GGMM分布,其均值为 ,标准差为 ,形状参数为 。
因此,输入矩阵 中每个元素 的概率可表示为:
(6)
然后定义输入矩阵 的可能性:
(7)
目标是最大化关于参数 , , , 的对数似然函数,即:
(8)
EM算法是求解对数似然函数最大化问题的有效算法。因此,在求解式(8)时,我们假设在EM框架下存在一个高维的潜变量。那么原问题可以看作是均值为0的高斯尺度混合(GSM)。定义 , 则公式(8)可以改写为:
(9)
为了最大化误差函数 ,我们定义了一个变量 。变量 定义为:
(10)
M步使E步给出的关于每个参数的上界最大化,得到新的误差函数:
(11)
M步更新U、V:仅对未知分量U、V重写公式(11),如下所示:
(12)
这里 表示Hadamard乘积(组件式乘法),W的元素 为
(13)
构建惩罚PGGMM模型:
(14)
其中, ,J为数据矩阵的列数, 是一个非常小的正数, 为调优参数( ), 是第n个分量自由参数的数量。
构造Q函数:
(15)
本文通过最大化Q函数来更新 ,对Q求一阶偏导数,并令导数为0,即可得到更新方程,
(16)
其中 。
在更新参数前,先简单介绍一下稳健统计理论。稳健统计理论是一门研究统计估计在存在异常值或非正常分布数据条件下依然保持可靠性的学科。传统的统计方法,如最小二乘法(LS),虽然在处理正态分布数据时表现良好,但对异常值极其敏感,可能导致估计结果失真。稳健统计通过引入对异常值不敏感的估计方法,提高估计的稳健性和准确性。
M估计是稳健统计中的一种重要方法,其核心思想是通过选择适当的目标函数 ,使得估计量对异常值的影响降到最低。具体来说,假设有一批观测值 ,其中U为估计值, 为误差项。M估
计通过最小化 来估计,即U的M估计量是使得其残差的某个函数值达到最小时的值。目标
函数 的选择影响估计的稳健性。选定合适的目标函数后,求 关于U的导数并设其和为零,得到更新后的U,将新的估计值带入 对 的导数,并令其为零,即可得到新的更新公式。具体操作如下。
在迭代步骤设置误差函数 对 的导数,我们有
(17)
根据稳健统计理论,任何估计值U是由一个隐式方程定义的:
(18)
这就给出了U位置作为加权平均值的数值解:
, (19)
其中, 是目标函数 的导数:
(20)
(21)
将其带入权重公式:
(22)
利用权重更新U,将新的估计值U带入到偏导数公式中,并求解使偏导数为零的 更新公式:
(23)
简化并解出 的表达式:
(24)
下一步是更新 参数。这涉及到保持其他参数不变,并使用Newton Raphson方法改进 的估计。每次迭代都要求目标函数 对参数 求一阶导数和二阶导数:
(25)
(26)
U,V是通过求解 来评估的。为了计算公式(12),本文采用ALMF算法(改
进的梯度下降算法),U和V矩阵的更新基于Adam优化器,并引入了动量项、学习率调度、梯度裁剪和Lookahead技术。
首先,计算误差矩阵和带权重的误差。误差矩阵 。带权重的误差 :
(27)
其中,W是输入的权重矩阵,X是原始数据矩阵, 是逐元素乘法。
基于误差矩阵,分别U和V进行梯度计算,并引入正则化项 和 ,得到U和V的梯度计算结果:
(28)
(29)
为了避免梯度爆炸问题,梯度裁剪将梯度限制在一个阈值c之内:
(30)
(31)
接下来,通过Adam优化器更新梯度,分别计算一阶和二阶动量估计 , 以及 , ,并对动量进行偏差校正,得到修正后的 , 和, , 。利用这些修正后的动量更新矩阵U和V,同时引入权重衰减项,使得优化过程更加稳定。
一阶和二阶动量估计为:
(32)
偏差校正结果为:
(33)
使用校正后的动量来更新U和V,同时引入权重衰减项:
(34)
其中, 是学习率, 是一个防止分母为零的小常数。
每隔k次迭代时执行Lookahead更新,通过在原始更新基础上慢更新U和V,并将慢更新结果赋值给U和V。
(35)
, 。
每次迭代后,重新计算误差:
(36)
如果误差小于设定的阈值,则停止迭代。采用ALMF方法更新U,V的过程由算法1给出,针对GGMM模型提出的算法总结在算法2中。
算法1 ALMF算法求解公式(12) |
输入:初始化U,V, , , , ,c。 |
1. 通过(27)计算 ; |
2. 通过(28)(29)计算 , ; |
3. 通过(32)(33)(34)更新 , , , ,U,V; |
4. 通过(35)更新 , |
输出U,V。 |
算法2 模型求解算法 |
输入:数据X;算法参数:秩r和 。 |
初始化 ,t = 0。 |
1:通过(16)更新 ; |
2:通过(24)更新 ; |
3:通过(26)更新 ; |
4:通过算法1更新 、 ; |
5:t = t + 1; |
输出:参数 |
在本节中,为了验证算法的有效性,进行了大量的合成数据实验和真实数据实验,并与MoG WLRMF、GGMM + EPLL进行对比。采用峰值信噪比(PSNR)、结构相似性(SSIM)、特征相似性(FSIM)、相对标准误差(RSE)四种评价指标来评价每种方法的性能。
为了验证算法的有效性,选择了干净图像Facade数据集进行合成数据实验。并设置了4种不同的噪声设置,分别为:
1) 加入零均值高斯噪声,方差为0.06;
2) 加入零均值高斯噪声,方差为30;
3) 加入混合噪声:[−5, 5]均匀噪声,(0, 0.2)和(0, 0.01)的高斯噪声
4) 加入混合噪声:[−35, −35]均匀噪声,(0, 20)和(0, 10)的高斯噪声
情况 |
评价指标 |
MoG WLRMF |
GGMM + EPLL |
Ours |
1 |
PSNR |
17.91 |
19.29 |
28.48 |
SSIM |
0.4865 |
0.8020 |
0.8526 |
|
FSIM |
0.9891 |
0.9670 |
0.9978 |
|
RSE |
0.2442 |
0.2120 |
0.0737 |
|
2 |
PSNR |
15.29 |
18.93 |
28.42 |
SSIM |
0.1212 |
0.6090 |
0.8521 |
|
FSIM |
0.8824 |
0.9420 |
0.9966 |
|
RSE |
0.2420 |
0.2210 |
0.0768 |
|
3 |
PSNR |
25.65 |
5.93 |
28.49 |
SSIM |
0.8236 |
0.0090 |
0.8528 |
|
FSIM |
0.9961 |
0.8930 |
0.9898 |
|
RSE |
0.1416 |
0.9880 |
0.0742 |
|
4 |
PSNR |
23.69 |
5.64 |
28.45 |
SSIM |
0.7862 |
0.0040 |
0.8528 |
|
FSIM |
0.9268 |
0.8930 |
0.9878 |
|
RSE |
0.1260 |
1.0210 |
0.0736 |
真实高光谱图像的数据实验使用HYDICE城市图像进行演示,此数据集的图像受到大气和水吸收等噪声的严重污染,
本文提出了一种新的基于GGMM的图像去噪算法,通过将GGMM引入低秩矩阵分解框架,对图像中的噪声进行建模,从而能够处理不同类型和复杂度的噪声。算法的参数通过EM算法进行求解。本文算法在多种公共数据集上的实验结果表明,与现有经典去噪方法(如MoG WLRMF、GGMM + EPLL等)相比,在PSNR和SSIM指标上具有显著提升,尤其在处理尖峰噪声和重尾噪声时表现出更强的鲁棒性和细节恢复能力。同时主观视觉质量也显著优于其他方法,充分验证了本研究的先进性和实用价值。
吉林省自然科学基金,NO. 20240101298JC;国家自然科学基金,NO. 12171054。