图像在采集和捕捉过程中,往往存在噪声污染和缺失等退化情况,而鲁棒补全对此发挥着重要作用。目前这些方法大多利用图像的全局低秩和局部平滑先验来对其进行建模,包括独立编码方法和融合编码方法。然而,这些方法要么需要对两个以上参数进行繁琐的调整,要么平等地对待梯度矩阵/张量的每个奇异值,从而限制了处理实际问题的灵活性。在本文中,我们提出了改进的张量相关全变分(ITCTV)范数,以充分利用梯度张量的内在结构特性。所提出的ITCTV正则化器不需要权衡参数来平衡两个先验,并且进一步有效地利用了梯度张量奇异值的先验分布信息。我们将提出的方法应用在多种类型的视觉张量数据上,实验结果证明了所提出方法在图像修复上的有效性。 In the process of image acquisition and capture, there is often degradation such as noise pollution and missing, and robust completion plays an important role in this. Most current methods for image restoration exploit global low-rankness and local smoothness priors to model them, including independent coding methods and fusion coding methods. However, these methods either require tedious tuning of more than two parameters or treat each singular value of the gradient matrices/tensors equally, thus limiting the flexibility to deal with practical problems. In this paper, we propose an improved tensor correlated total variation (ITCTV) norm to take full advantage of the intrinsic structural properties of the gradient tensors. The proposed ITCTV regularizer does not need to trade-off parameters to balance the two priors, and further effectively utilizes the prior distribution information of the singular values of the gradient tensors. We apply the proposed method to various types of visual tensor data, and the experimental results prove the effectiveness of the proposed method in image restoration.
图像在采集和捕捉过程中,往往存在噪声污染和缺失等退化情况,而鲁棒补全对此发挥着重要作用。目前这些方法大多利用图像的全局低秩和局部平滑先验来对其进行建模,包括独立编码方法和融合编码方法。然而,这些方法要么需要对两个以上参数进行繁琐的调整,要么平等地对待梯度矩阵/张量的每个奇异值,从而限制了处理实际问题的灵活性。在本文中,我们提出了改进的张量相关全变分(ITCTV)范数,以充分利用梯度张量的内在结构特性。所提出的ITCTV正则化器不需要权衡参数来平衡两个先验,并且进一步有效地利用了梯度张量奇异值的先验分布信息。我们将提出的方法应用在多种类型的视觉张量数据上,实验结果证明了所提出方法在图像修复上的有效性。
鲁棒补全,改进的张量相关全变分,先验信息,图像修复
Kai Huang1, Zhongning Li2
1School of Mathematics and Statistics, Southwest University, Chongqing
2Yinchuan Energy Institute Foundation Department, Yinchuan Ningxia
Received: Mar. 3rd, 2024; accepted: May 6th, 2024; published: May 14th, 2024
In the process of image acquisition and capture, there is often degradation such as noise pollution and missing, and robust completion plays an important role in this. Most current methods for image restoration exploit global low-rankness and local smoothness priors to model them, including independent coding methods and fusion coding methods. However, these methods either require tedious tuning of more than two parameters or treat each singular value of the gradient matrices/tensors equally, thus limiting the flexibility to deal with practical problems. In this paper, we propose an improved tensor correlated total variation (ITCTV) norm to take full advantage of the intrinsic structural properties of the gradient tensors. The proposed ITCTV regularizer does not need to trade-off parameters to balance the two priors, and further effectively utilizes the prior distribution information of the singular values of the gradient tensors. We apply the proposed method to various types of visual tensor data, and the experimental results prove the effectiveness of the proposed method in image restoration.
Keywords:Robust Completion, Improved Tensor Correlated Total Variation, Prior Information, Image Restoration
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着当前人工智能、大数据、云计算等现代信息技术的快速发展,在计算机视觉、生物医学等诸多应用领域中产生了多种多样的张量数据。其中图像因其在信息传达上具有直观、形象的特点,在信息传播中该数据存在形式占据了大部分。然而,这些图像在采集和捕捉过程中,由于受到传输物质、成像设备等自身的局限,甚至被外部环境干扰,导致图像总是会存在明显的退化,比如受到不同程度的各种噪声的污染或者缺失等。这些退化会严重降低图像的质量,进而影响后续处理的准确性。因此,如何修复这些图像成为了改善后续任务(如目标检测 [
上述退化问题实际上产生了张量恢复研究中的两个经典逆问题,即张量鲁棒主成分分析(TRPCA) [
然而,由于这两个先验在现实世界中通常是相互耦合的,即它们并不像传统模型中所暗示的那样独立发生,而且在实际场景中构建微调这两个独立正则化项对应的权衡参数的一般准则具有挑战性。鉴于上述情况,最近的工作 [
为了解决上述问题,我们引入了改进的张量相关全变分(ITCTV)范数,其中使用的改进策略有助于进一步表征梯度张量的低秩性和固有稀疏性。我们的主要动机是梯度张量中那些较大的奇异值应该受到较少的惩罚,这是相当合理的。因此,我们对梯度张量采用重加权策略,以利用上述存在的先验信息。对于重加权策略的选择,我们采用了相关文献 [
为了充分利用梯度域下梯度张量的奇异值的先验分布信息,以此提高TCTV范数 [
‖ X ‖ I T C T V : = 1 3 ∑ k = 1 3 ‖ G k ‖ w , ⊛ , L (1)
其中 L 代表可逆线性变换,它可以是离散傅里叶变换(DFT)或离散余弦变换(DCT),或其他一些可逆线性变换,只要可逆线性变换所对应的变换矩阵满足 U n 3 × U n 3 ∗ = U n 3 ∗ × U n 3 = n 3 I n 3 。
为了方便起见,我们忽略下标,将上面梯度张量的重加权核范数定义为:
‖ G ‖ w , ⊛ , L = 1 n 3 ∑ i = 1 n 3 ‖ G L ( i ) ‖ w , ⊛ = 1 n 3 ∑ i = 1 n 3 ∑ j = 1 min { n 1 , n 2 } w i j σ j ( G L ( i ) ) (2)
其中 w i j = c / ( σ j ( G L ( i ) ) + ε ) 1 − p 且 0 < p ≤ 1 ,本文统一设 1 − p = q ;c为常数,本文实验中默认设置 c = 1 ; ε 是一个足够小的正数,以避免在对应的奇异值为零时被零除,在本文的实验中设置为 ε = 10 − 8 。已经证明,当给矩阵的重加权核范数赋予这样的权重时,它可以逼近其对应的Schatten-p范数 [
本小节我们给出矩阵加权奇异值阈值算子的相关引理,并基于此给出张量加权奇异值阈值算子的相关定理及其证明。
引理(WSVT) [
D w , τ ( Y ) = U S w , τ V T (3)
其中 S w , τ = D i a g { ( σ i ( X ) − τ w i ) + , i = 1 , 2 , ⋯ , m } 。对于任意 τ > 0 且 Y ∈ ℝ n 1 × n 2 ,WSVT算子满足:
D w , τ ( Y ) = arg min X τ ‖ X ‖ w , ∗ + 1 2 ‖ X − Y ‖ F 2 (4)
定理(t-WSVT):对于给定的张量 Y ∈ ℝ n 1 × n 2 × n 3 ,将其t-SVD表示为 Y = U ∗ L S ∗ L V T 。然后,对于任何 τ > 0 且具有非降序权重 0 ≤ w 1 i ≤ w 2 i ≤ ⋯ ≤ w d i ( d = min { n 1 , n 2 } , i = 1 , 2 , ⋯ , n 3 ) ,对于每个 τ > 0 ,我们定义张量加权奇异值阈值(t-WSVT)算子如下:
D W , τ ( Y ) = U ∗ L S W , τ ∗ L V T (5)
其中 S W , τ = L − 1 ( ( S L − τ W ) + ) 。注意 t + 表示t的正数部分,即 t + = max ( t , 0 ) ;而 W ∈ ℝ n 1 × n 2 × n 3 是f-对角张量,其第i个正面切片的对角线元素等于权重矩阵 W = ( w j i ) d × n 3 的第i列。特别地,当可逆线性变换 L 为DFT时, S W , τ = i f f t ( ( S ¯ − τ W ) + , [ ] , 3 ) 。对于任意 τ > 0 且 Y ∈ ℝ n 1 × n 2 × n 3 ,t-WSVT算子满足:
D W , τ ( Y ) = arg min X τ ‖ X ‖ w , ∗ , L + 1 2 ‖ X − Y ‖ F 2 (6)
证明:式(6)等价于
min X τ 1 n 3 ∑ i = 1 n 3 ∑ j = 1 min { n 1 , n 2 } w i j σ j ( X L ( i ) ) + 1 2 n 3 ‖ b d i a g ( X L ) − b d i a g ( Y L ) ‖ F 2 = min X 1 n 3 ∑ i = 1 n 3 ( τ ∑ j = 1 min { n 1 , n 2 } w i j σ j ( X L ( i ) ) + 1 2 ‖ X L ( i ) − Y L ( i ) ‖ F 2 ) (7)
注意变量 X L ( i ) 是独立的。那么,上述问题可以分解为 n 3 个独立的子问题。该定理表明t-WSVT算子 D W , τ ( Y ) 给出了具有特定线性变换的张量重加权核范数的阈值收缩解。
基于所提出的ITCTV正则化器,我们构建如下的鲁棒张量修补模型:
min 1 3 ∑ k = 1 3 ‖ G k ‖ w , ⊛ , L + λ ‖ E ‖ 1 s .t . P Ω ( X + E ) = P Ω ( M ) , G k = ∇ k ( X ) (8)
通过引入辅助变量 K ,使得 X + E = M + K ,那么上述模型(8)可以重新表述为:
min 1 3 ∑ k = 1 3 ‖ G k ‖ w , ⊛ , L + λ ‖ E ‖ 1 s .t . X + E = M + K , P Ω ( K ) = 0 , G k = ∇ k ( X ) (9)
根据ADMM框架 [
L ( X , { G k , k = 1 , 2 , 3 } , E , K , { Λ k , k = 1 , 2 , 3 } , ϒ ) = ∑ k = 1 3 ( 1 3 ∑ k = 1 3 ‖ G k ‖ w , ⊛ , L + 〈 Λ k , ∇ k ( X ) − G k 〉 + μ 2 ‖ ∇ k ( X ) − G k ‖ F 2 ) + 〈 ϒ , M + K − X − E 〉 + μ 2 ‖ M + K − X − E ‖ F 2 + λ ‖ E ‖ 1 (10)
其中 { Λ k , k = 1 , 2 , 3 } 和 ϒ 是拉格朗日乘子, μ 是惩罚参数。那么基于ADMM的框架,第(t + 1)次迭代中模型(9)中所涉及变量的更新方式具体如下:
更新 X t + 1 :通过增广拉格朗日函数(10)式,可以得到关于 X 的优化子问题:
X t + 1 = arg min X ∑ k = 1 3 ( 〈 Λ k t , ∇ k ( X ) − G k t 〉 + μ t 2 ‖ ∇ k ( X ) − G k t ‖ F 2 ) + 〈 ϒ t , M + K t − X − E t 〉 + μ t 2 ‖ M + K t − X − E t ‖ F 2 = arg min X ∑ k = 1 3 μ t 2 ‖ ∇ k ( X ) − G k t + Λ k t μ t ‖ F 2 + μ t 2 ‖ M + K t − X − E t + ϒ t μ t ‖ F 2 (11)
对(11)中的 X 求导,我们可以得到更新 X 的方程为:
( I + ∑ k = 1 3 ∇ k T ∇ k ) ( X ) = M + K t − E t + ϒ t μ t + ∑ k = 1 3 ∇ k T ( G k t − Λ k t μ t ) (12)
其中 ∇ k T ( · ) 表示 ∇ k ( · ) 的转置结果运算符。那么我们可以在傅里叶域中,考虑将 ∇ k ( · ) 对应的差分张量 D k 对角化,并利用卷积定理得到式(12)的最优解来更新 X :
X t + 1 = F − 1 ( F ( M + K t − E t + ϒ t / μ t ) + H 1 + ∑ k = 1 3 F ( D k ) * ⊙ F ( D k ) ) (13)
其中 H = ∑ k = 1 3 F ( D k ) * ⊙ F ( G k t − Λ k t / μ t ) , 1 为所有元素均为1的张量, ⊙ 是逐元素乘法。
更新 G k t + 1 :通过增广拉格朗日函数(10)式,可以得到关于 G k 的优化子问题:
G k t + 1 = arg min G k 1 3 ‖ G k ‖ w , ⊛ , L + 〈 Λ k t , ∇ k ( X t + 1 ) − G k 〉 + μ t 2 ‖ ∇ k ( X t + 1 ) − G k ‖ F 2 = arg min G k 1 3 ‖ G k ‖ w , ⊛ , L + μ t 2 ‖ ∇ k ( X t + 1 ) − G k + Λ k t μ t ‖ F 2 (14)
因此,我们可以通过之前定义的t-WSVT阈值算子来更新 G k t + 1 ,即
G k t + 1 = t − W S V T 1 / 3 μ t ( ∇ k ( X t + 1 ) + Λ k t μ t ) (15)
更新 E t + 1 :通过增广拉格朗日函数(10)式,可以得到关于 E t + 1 的优化子问题:
E t + 1 = arg min E λ ‖ E ‖ 1 + 〈 ϒ t , M + K t − X t + 1 − E 〉 + μ t 2 ‖ M + K t − X t + 1 − E ‖ F 2 = arg min E λ ‖ E ‖ 1 + μ t 2 ‖ M + K t − X t + 1 − E + ϒ t μ t ‖ F 2 (16)
通过使用下面定义的张量软阈值算子,我们可以得到以下阈值收缩等式来更新 E t + 1 ,即
E t + 1 = S λ / μ t ( M + K t − X t + 1 + ϒ t μ t ) (17)
其中 S ζ ( · ) 是关于阈值为 ζ 的张量软阈值算子,满足:
[ S ξ ( X ) ] i j k = sgn ( x i j k ) max ( | x i j k | − ξ , 0 ) (18)
更新 K t + 1 :
K t + 1 = X t + 1 + E t + 1 − M − ϒ t μ t , P Ω ( K t + 1 ) = 0 (19)
更新乘子 Λ k t + 1 和 ϒ t + 1 :
{ Λ k t + 1 = Λ k t + μ t ( ∇ k ( X t + 1 ) − G k t + 1 ) ϒ t + 1 = ϒ t + μ t ( M + K t + 1 − X t + 1 − E t + 1 ) (20)
我们将上述基于ITCTV的鲁棒张量修补算法总结在算法1中。
在本节中,为了证明所提出的ITCTV方法在图像修复方面的有效性,我们将其应用到彩色图像、HSI以及灰度视频中。我们选择几种流行的鲁棒补全方法与我们的方法进行比较,即SNN [
在进行模拟实验中,我们主要考虑不同采样率 s r = { 0.1 , 0.2 , 0.6 , 0.8 } 与噪声比例 σ = 0.1 组合的几种图像的退化情况。对于所提出的鲁棒张量修补模型中的参数,我们将其中的 λ 默认设置为 λ = 1 / n 3 max ( n 1 , n 2 ) ,而用于控制梯度张量 G k 的奇异值收缩的权重参数q,可以从一定范围内进行选择,如 { 0 .1, 0 .2, 0 .3, 0 .4, 0 .5, 0 .6, 0 .7, 0 .8, 0 .9, 1 } ,我们根据经验在实验中默认设置 q = 0.1 ,针对不同的视觉张量数据,也可以进行微调。
本节我们将所提出的方法应用于彩色图像、HSI以及灰度视频的恢复中,其中每个彩色图片的大小为 481 × 321 × 3 ,HSI裁剪过后的大小为 200 × 200 × 50 ,灰度视频的大小为 144 × 176 × 100 。我们将所提出的方法与上述提到的5种方法进行比较,PSNR或MPSNR数值结果如表1~3所示,其中的数值是各类型所有挑选图像实验指标的平均值,最优结果通过粗体突出显示。可以看出,在不同采样率和噪声水平下,我们所提出的方法均达到了最优的恢复效果。同TCTV方法相比,由于进一步充分利用了梯度张量的奇异值的先验分布信息,因此恢复效果也有了显著提升。除此之外,HSI相比彩色图片等图像低秩性更强,我们的方法在梯度域下利用梯度张量的先验信息也更加充分,因此在HSI这种波段更多、低秩性更强的视觉张量数据上更有竞争力。
退化情况 | s r = 0.1 , σ = 0.1 | s r = 0.2 , σ = 0.1 | s r = 0.6 , σ = 0.1 |
|
---|---|---|---|---|
方法/指标 | PSNR | PSNR | PSNR | PSNR |
SNN | 19.1466 | 22.4488 | 26.0652 | 29.3156 |
TNN | 12.3232 | 16.2716 | 23.3288 | 25.8343 |
TTNN | 15.7325 | 16.6266 | 17.6519 | 17.9405 |
TNTV | 17.0341 | 18.0547 | 18.7968 | 19.0783 |
TCTV | 19.7290 | 22.7785 | 27.9499 | 30.1426 |
ITCTV | 23.5857 | 25.9894 | 29.2547 | 31.0178 |
表1. 不同退化情况下彩色图片在不同方法上的性能评估
退化情况 | s r = 0.1 , σ = 0.1 | s r = 0.2 , σ = 0.1 | s r = 0.6 , σ = 0.1 | s r = 0.8 , σ = 0.1 |
---|---|---|---|---|
方法/指标 | MPSNR | MPSNR | MPSNR | MPSNR |
SNN | 22.9449 | 25.8609 | 34.7329 | 40.0899 |
TNN | 22.4525 | 26.5220 | 36.9603 | 40.7484 |
TTNN | 30.9915 | 34.2613 | 38.9871 | 41.9535 |
TNTV | 26.2492 | 29.0595 | 35.5640 | 37.7247 |
TCTV | 28.0984 | 31.7142 | 40.7714 | 43.8155 |
ITCTV | 33.3966 | 37.5034 | 42.9507 | 45.9741 |
表2. 不同退化情况下HSI在不同方法上的性能评估
退化情况 | s r = 0.1 , σ = 0.1 | s r = 0.2 , σ = 0.1 | s r = 0.6 , σ = 0.1 | s r = 0.8 , σ = 0.1 |
---|---|---|---|---|
方法/指标 | MPSNR | MPSNR | MPSNR | MPSNR |
SNN | 20.2276 | 23.2674 | 31.6904 | 33.9525 |
TNN | 20.8164 | 23.6106 | 29.3599 | 31.3817 |
TTNN | 25.1260 | 28.2120 | 31.2334 | 32.3921 |
TNTV | 21.3082 | 23.0496 | 26.4624 | 28.4710 |
TCTV | 24.6216 | 27.0840 | 31.9058 | 33.5797 |
ITCTV | 28.5466 | 30.5443 | 33.0015 | 34.6850 |
表3. 不同退化情况下灰度视频在不同方法上的性能评估
为了从视觉上展示更加直观的恢复效果,我们展示了所有竞争方法在部分图像上的视觉恢复结果。图1~3分别展示了彩色图片、HSI和灰度视频在不同采样率下的恢复结果。可以看出,我们的方法同TCTV一样,在梯度域下进行建模不仅刻画了低秩性,同时编码了局部平滑先验,因此在局部细节以及边缘上的恢复更好。综上所述,我们所提出的方法在数值和视觉上都具有更加优越的恢复性能。
图1. 彩色图片在0.2采样率,0.1噪声比例下各方法的恢复效果
图2. HSI在0.6采样率,0.1噪声比例下各方法的恢复效果
图3. 灰度视频在0.8采样率,0.1噪声比例下各方法的恢复效果
考虑到t-SVD框架依赖于方向和特定变换(例如DFT、DCT、酉变换和小波变换等),我们探讨了所提出的模型使用的ITCTV范数在不同变换下的恢复结果。表4显示了TCTV方法和我们提出的ITCTV方法在基于DFT的t-SVD框架、基于DCT的t-SVD框架和基于酉变换的t-SVD框架下不同视觉张量数据恢复的定量比较。结果表明,与DFT相比,基于DCT的t-SVD框架下的恢复性能可以进一步提高。通过将可逆线性变换改为基于数据的酉变换,还可以进一步提高恢复性能。这与 [
退化情况 | TCTV (F) | TCTV (C) | TCTV (U) | ITCTV (F) | ITCTV (C) | ITCTV (U) | |
---|---|---|---|---|---|---|---|
彩色图像 | |||||||
s r = 0.1 , σ = 0.1 | 23.2987 | 23.5597 | 23.5792 | 26.9972 | 27.1322 | 27.5794 | |
s r = 0.2 , σ = 0.1 | 27.1167 | 27.1994 | 27.2023 | 30.6963 | 30.9261 | 31.2168 | |
s r = 0.6 , σ = 0.1 | 33.3609 | 33.4471 | 33.6770 | 34.7119 | 35.7284 | 36.1611 | |
s r = 0.8 , σ = 0.1 | 35.2936 | 35.3883 | 35.5992 | 35.7304 | 36.8277 | 37.4683 | |
HSI | |||||||
29.8517 | 29.8674 | 29.9594 | 35.1623 | 35.5197 | 35.8505 | ||
s r = 0.2 , σ = 0.1 | 33.2334 | 33.2652 | 33.4474 | 39.0102 | 39.8920 | 40.4556 | |
s r = 0.6 , σ = 0.1 | 40.2902 | 40.4290 | 40.7660 | 44.0501 | 45.1583 | 45.4600 | |
s r = 0.8 , σ = 0.1 | 42.4190 | 42.7358 | 43.1154 | 45.4282 | 45.5901 | 46.0923 | |
灰度视频 | |||||||
s r = 0.1 , σ = 0.1 | 27.6108 | 27.6852 | 27.7408 | 32.5737 | 32.6378 | 32.6942 | |
s r = 0.2 , σ = 0.1 | 29.6837 | 29.8120 | 29.9279 | 35.4975 | 35.7699 | 36.1460 | |
s r = 0.6 , σ = 0.1 | 35.3117 | 35.3488 | 35.3618 | 41.5674 | 41.6759 | 41.8868 | |
s r = 0.8 , σ = 0.1 | 37.3666 | 37.4352 | 37.5836 | 43.1393 | 43.5329 | 43.8648 |
表4. TCTV和ITCTV方法在不同可逆线性变换下的性能比较
在本文中,我们通过重加权策略引入了一种改进的张量相关全变分(ITCTV)范数,并将其应用于图像修复。所提出的ITCTV范数不仅同时表征了全局低秩和局部平滑两个先验,减少了两个先验正则化项对应的参数,而且还进一步提高了区分控制梯度张量不同奇异值的灵活性。所提出的方法在不同类型的视觉张量数据上的实验结果证明了该方法在图像修复上的有效性。在未来的工作中,我们将考虑双线性分解对模型算法进行加速,以及将ITCTV正则化器推广至更一般的非线性变换框架。
黄 凯,李忠宁. 融合改进的张量相关全变分的鲁棒张量修补用于图像修复Robust Tensor Completion Fusing Improved Tensor Correlated Total Variation for Image Restoration[J]. 人工智能与机器人研究, 2024, 13(02): 255-264. https://doi.org/10.12677/airr.2024.132027
https://doi.org/10.1109/TIP.2016.2627803
https://doi.org/10.1109/TGRS.2020.2964627
https://doi.org/10.1109/TIP.2009.2025560
https://doi.org/10.1109/TPAMI.2019.2891760
https://doi.org/10.1109/TPAMI.2012.39
https://doi.org/10.1109/TNNLS.2021.3051650
https://doi.org/10.1109/JSTARS.2017.2779539
https://doi.org/10.1109/TPAMI.2022.3204203
https://doi.org/10.1109/TPAMI.2023.3259640
https://doi.org/10.1109/TIP.2019.2949383
https://doi.org/10.1109/TSP.2022.3183466
https://doi.org/10.1093/biomet/ast036
https://doi.org/10.1561/2200000016
https://doi.org/10.1137/130905010
https://doi.org/10.1002/nla.2299
https://doi.org/10.1016/j.neucom.2020.12.110
https://doi.org/10.1109/TIP.2022.3155949