1. 引言
全息术是一种基于光的干涉和衍射原理的三维成像技术,通过记录物体光波的幅度和相位信息来重建物体的三维结构,广泛应用于生物医学成像[1]、材料检测[2]等领域。然而,散斑噪声[3]是全息成像中的一种常见问题,主要由激光等相干光源引起,表现为图像中的不规则亮度变化。散斑噪声会降低图像的质量[4],特别是在高密度条纹区域,使得图像模糊不清;同时,它还会影响相位信息的精确重建,导致三维结构的误差。此外,散斑噪声的存在增加了后续图像处理的复杂性,必须进行有效的去噪处理才能获得准确的成像结果,因此散斑噪声的抑制成为全息术中亟待解决的关键问题。
抑制散斑噪声的方法主要分为三大类,包括低相干光源照明法、多张全息图重叠平均法和数字图像处理法。前两种方法分别通过使用低相干光源减少散斑噪声的产生,和通过多张全息图重叠平均来降低噪声影响,但这两种方法都存在一定的局限性,前者对光学系统的要求较高,后者难以实现实时成像。数字图像处理法则在处理散斑噪声方面取得了较大进展。2005年,Garcia-Sucerquia等人采用中值滤波对全息图再现像进行抑制[5],虽然在一定程度上降低了散斑噪声,但导致图像细节的丢失。随后,非局部均值(Non-Local Means, NLM)滤波被提出,该方法通过计算像素邻域的相似性权重来平滑图像,有效地保留了细节信息的同时抑制了噪声。2007年,Kostadin Dabov等人提出块匹配三维滤波(Block-Matching and 3D Filtering, BM3D) [6]方法通过对图像块进行匹配,利用3D变换对相似的图像块进行联合处理,有效地抑制了散斑噪声并保留了图像的细节等人采用小波变换进行散斑去噪,相较于传统的空间域滤波器,小波变换能够更精确地处理高频噪声,进而保留了重建图像中的边缘信息,提升了信噪比。2017年,吴小虹等人提出了一种结合TV正则化和维纳滤波的方法,增强了图像的边缘细节,使再现像更加清晰[7]。2021年,牛瑞等人利用窗口傅里叶变换方法(Windowed Fourier Transform, WFT) [8],通过在频域中选取合适的阈值去除噪声频谱,再通过逆变换重建低噪声的包裹相位图像,展示了在三维重建中的高效性。
近年来神经网络,尤其是深度学习技术,在图像处理领域中取得了显著进展,特别是在去噪任务中。通过大量的数据训练,神经网络能够从复杂的噪声模式中提取特征并进行有效去噪。近年来,越来越多的研究开始应用神经网络去除全息图中的散斑噪声。2019年,Hao等人提出了一种基于卷积神经网络(CNN)的批量去噪算法[9],该方法通过训练条纹图像来提取噪声分量并进行抑制,适用于中等噪声和中等条纹密度,但在高密度条纹区域仍存在边缘模糊问题。2020年,Yan等人改进了DnCNN网络结构[10],旨在降低数字全息散斑干涉术中的相位噪声。实验结果表明,该方法在高密度条纹区域和普通噪声水平下能有效去噪,但条纹边缘的恢复仍存在不足。2021年,Li等人提出了基于膨胀卷积块的深度神经网络(DBDNet) [11],通过级联和多层特征融合机制,显著提升了在高噪声水平下的图像恢复能力。2022年,Javier提出了基于U-Net的轻量级残差密集神经网络LRDUNet [12],用于解决ESPI条纹图案的去噪问题针对全息成像实验中散斑噪声导致的重建质量下降问题,我们提出了一种基于Inception与U-Net网络框架融合的散斑噪声去除方法。通过仿真和实验验证,相较于传统去噪算法和部分神经网络方法,该方法在有效去除散斑噪声的同时,显著提升了全息图的重建质量。
2. 网络架构及训练
2.1. 网络基本架构
我们网络基于U-Net结构,并引入注意力机制(CBAM)和改进型Inception残差块(Res-IncepB),整体网络结构如图1所示。在编码器(Encoder)部分,网络主要通过Res-IncepB结构进行特征提取,并通过2 × 2最大池化逐步降低特征图的空间分辨率。在解码器(Decoder)部分,每一层通过反卷积进行上采样,并与编码器对应层的特征映射进行跳跃连接,以保留更多细节信息。解码器的每一层由Res-IncepB结构和CBAM结构组成。其中,Res-IncepB结构可有效防止上采样过程中关键信息的丢失,而CBAM进一步优化通道和空间维度上的特征分配,增强关键区域信息的表达,同时抑制无关特征,提高去噪能力。
Figure 1. Network architecture diagram
图1. 网络架构图
传统的残差块结构通常由两个3 × 3标准卷积组成,固定的感受野(Receptive Field)可能限制模型对不同尺度细节的捕捉能力。因此,本文采用了一种基于Inception结构的改进型残差块Res-IncepB,以增强特征表达能力。如图2所示该模块由多个不同感受野的分支组成,其中主分支采用1 × 1卷积以保持通道维度的一致性,并降低计算复杂度;而旁路由四个不同尺度的卷积结构组成,分别采用单层、双层、三层及四层堆叠的3 × 3卷积进行特征提取,以增强模型对不同层次空间特征的建模能力。最终,各分支提取的特征在通道维度上拼接,并与主分支输出进行逐元素相加,随后通过非线性激活函数进行处理,以提升网络的特征表达能力。
CBAM模块如图3所示,他分为两个主要步骤:通道注意力和空间注意力。在通道注意力部分,通过全局平均池化和全局最大池化聚合全局信息,生成每个通道的权重。接着,通过一个共享的全连接层映射这些信息,调整通道的重要性,从而强化关键信息的表达。在空间注意力部分,CBAM通过卷积操作生成空间注意力图。它通过聚合不同通道的信息(如平均池化或最大池化),生成空间权重图,突出重要区域并抑制无关信息。这一机制有效提高了模型对关键特征的关注。
Figure 2. Structure of the Res-IncepB module
图2. Res-IncepB模块结构
Figure 3. Attention module diagram
图3. 注意力模块图
2.2. 网络训练参数设置
本次网络的训练环境配置如下:操作系统为Python 3.8,CUDA版本为11.8,CPU为AMD EPYC 9654 96核处理器,硬件系统采用主板Intel i9-10900K,显卡为英伟达GeForce RTX 4090 (24 GB),并配备60 GB的运行内存。整个网络训练过程耗时约4小时。训练网络用于相位散斑去噪,处理每张大小为256 × 256像素的图像时,其推理时间为0.02秒。在训练过程中,模拟数据集的网络训练迭代次数为100次,Batch Size设置为32,初始学习率为0.01,并采用每轮下降15%的学习率调度策略。网络优化器使用Adam,损失函数选择L1Loss。
3. 实验和结果分析
3.1. 数据集生成
本研究采用仿真方法生成包裹相位数据集,以提供高质量的训练和测试样本。数据集共包含10000张图像,其中8000张用于训练,1000张用于验证,1000张用来测试。具体的生成步骤如下:
1) 初始矩阵生成
采用随机初始化方法,生成一个小尺寸的相位矩阵,其大小在2 × 2到8 × 8之间。矩阵的值服从均匀分布,确保相位图具有随机性和多样性。
2) 插值放大
通过双线性插值,将初始矩阵扩展到256 × 256的目标尺寸。插值方法用于平滑相位变化,避免由于矩阵尺寸较小导致的相位突变,提高数据的连续性。
3) 包裹相位计算
通过复指数变换,将相位映射到
范围内,计算公式如下:
(1)
式中,
为插值放大后的绝对相位。
为对应的包裹相位。
4) 添加散斑噪声
为模拟实际光学系统中的噪声干扰,我们为每幅包裹相位图像添加随机散斑噪声。噪声的强度等级设定为[1, 5]之间的随机值,遵循乘性噪声模型:
(2)
(3)
其中,G为均值为0,标准差为1的高斯噪声,
为随机选取的噪声等级,
和
代表添加噪声后的相位分量。最终的包裹相位计算如下:
(4)
本次实验共生成10,000张图像。每个训练样本均由一幅含噪声的包裹相位图(输入)和对应的无噪声包裹相位图(标签)组成,以提供监督学习所需的数据。图4展示了所生成的数据集,其中a是无噪声的包裹相位,b是噪声的包裹相位。1~5是噪声的水平。
Figure 4. Dataset with different noise levels
图4. 不同噪声等级的数据集
3.2. 仿真实验
为了验证我们算法的可行性,还将其与三种代表性算法BM3D、WFT和DBDNet进行比较,如图5所示。可以直观地看到本文算法的去噪算法在去噪效果和图像细节还原上的效果都要优于其他算法。而且随着噪声等级的增大越来越明显。为了对图5仿真图像的成像结果进行客观评价,本文对两种方法的重建图像的峰值信噪比(PSNR: Peak signal-to-noise ratio)和结构相似度(SSIM Structural similarity)作为评价指标,其定义如下:
(5)
式中:
(6)
MSE表示当前图像X和参考图像Y的均方误差,H、W分别为图像的高度和宽度,PSNR数值越大即图像质量越好。
SSIM (Structural Similarity Index)是一种图像质量评价指标,它主要用于评估两个图像之间的结构相似性。SSIM与传统的峰值信噪比(PSNR)等指标相比,更能够反映人眼对图像质量的感知。
(7)
式中:x和y分别为输入的两张图像,c1,c2,c3分别为常数。
和
分别表示x和y的平均值,
和
分别表示x和y的标准差,
表示x和y的协方差,SSIM越大表示图像质量越好。表1分别表示对图5的三个不同噪声的包裹相位图进行定量分析,其中数值为三种不同噪声等级的平均值,可以看出本文所提出的算法在抑制散斑噪声方面优于其他方面。
Figure 5. Speckle noise suppression results of different algorithms
图5. 不同算法的抑制散斑噪声结果
Table 1. Quantitative index values of simulation results
表1. 仿真量化指标结果
算法 |
PSNR (dB) |
SSIM |
Time (s) |
BM3D |
8.36 |
0.27 |
331.2 |
WFT |
14.09 |
0.56 |
13.65 |
DBDNet |
22.45 |
0.95 |
3.15 |
Ours |
25.31 |
0.98 |
3.34 |
3.3. 成像实验
本文的成像实验使用了Mach-Zehnder光路的实验装置,如图6所示,氦氖激光器(632.8 nm)发出的光经准直透镜和扩束镜形成准直光束,随后通过第一分束镜分成两束光,一束作为参考光直接传输,另一束作为物光照射待测物体并携带相位信息被显微镜放大。两束光在第二分束镜处重新合束并产生干涉,全息图由CCD相机捕捉并存储。
Figure 6. Mach-Zehnder experimental optical setup
图6. Mach-Zehnder光路图
Figure 7. The phase unwrapping results after denoising with different algorithms
图7. 不同算法去噪后相位展开图
在实验中,我们使用血细胞作为样品,具体的成像结果如图7所示,其中图7(a)为CCD相机拍摄的全息图,图7(b)~(e)为经算法去噪并解包裹相位后的结果。图7(b)为我们提出算法的去噪结果,图7(c)为DBDNet算法的去噪结果,图7(d)为LRDUNet算法的去噪结果,图7(e)为BM3D去噪后的结果。从图中可以看出,图7(e)中底座的形态明显比图7(b)~(d)更加不规则,且形态差异较大。图7(d)中顶端呈现出一定的突起,而图7(c)表面虽然光滑,但整体结构与图7(b)、图7(d)、图7(e)相比,存在明显的形变。
4. 总结
本文针对全息图像中的散斑噪声问题,提出了一种改进的U-Net结构用于散斑抑制。我们基于传统U-Net架构,结合改进型Inception残差块(Res-IncepB)和注意力机制(CBAM),增强了模型对不同尺度空间特征的提取能力,并提升了去噪效果。在仿真实验中,我们将所提出的方法与BM3D、WFT、DBDNet等三种代表性方法进行了对比。实验结果表明,本文方法在PSNR和SSIM值上均优于其他算法。此外,通过相位重建实验,本文方法在实际应用中的散斑抑制效果也优于其他方法,能够有效恢复全息图像的细节,并减少噪声对图像质量的影响。结果表明,我们提出的网络结构在散斑噪声抑制及全息图像重建中具有良好的应用前景。
基金项目
广东省普通高校创新团队项目(2020KCXTD051);江门市基础与应用基础研究重点项目(No. 2021030103730007331)。