MFENet: Multi-Frequency Edge Detection Network for Plant Camouflage
This paper addresses the problems of low signal-to-noise ratio, dynamic interference, and fine-grained recognition in the task of plant camouflage detection. We propose a multi-frequency edge dynamic detection network (MFENet) to enhance the accuracy and robustness of concealed plant detection in complex ecological scenes. MFENet employs a multi-scale frequency separation module to address the low signal-to-noise ratio issue by utilizing multi-scale grouped convolutions to separate low-frequency global features from high-frequency detail features. Additionally, we construct a Channel-Aware Edge Attention module that combines Sobel edge priors with channel-space attention to optimize fine-grained features. To further enhance detection accuracy, we introduce an edge intensity-driven dynamic iterative feedback mechanism to adaptively adjust computational complexity. On the PlantCamo dataset, MFENet shows significant improvements in all evaluation metrics compared to conventional camouflage detection models. Ablation studies validate the effectiveness of each module. MFENet significantly enhances the accuracy and efficiency of plant camouflage detection, providing reliable technical support for ecological protection and agricultural monitoring.
Plant Camouflage Detection
伪装
然而,与动物和人类伪装相比,植物伪装的研究尚显不足。植物伪装检测
植物伪装检测研究具有重要的科学意义和广泛的应用价值。深入研究伪装植物的检测方法,不仅有助于理解植物适应环境的生存策略,还可为生态学研究提供新的视角,提升物种识别的准确性,为农业生产中的濒危植物保护和生长监控提供技术支持。此外,在军事与安全领域,该技术可用于伪装目标的侦查与监测。结合遥感与无人机技术,植物伪装检测在自然保护、植被恢复及非法采伐防控等方面也有着重要的应用潜力,对生态环境保护与可持续发展意义深远。
为了评估现有COD模型在植物伪装检测任务中的表现,我们基于专用数据集PlantCamo
本文的主要贡献如下:
如
输入图像在经过骨干网络特征提取和SAFS模块处理后,对伪装目标的整体感知效果有了明显提升,但仍存在边缘模糊与背景干扰等问题,CAEA (Channel-Aware Edge Attention)通道感知边缘注意力模块旨在通过融合边缘先验与多粒度通道注意力解决相关问题。如
伪装目标通常与背景在颜色和纹理上高度相似,因此,边缘信息在伪装目标检测中起着至关重要的作用。为了增强模型对目标边缘的感知能力,我们设计了边缘学习注意力模块(Edge Learning Attention Module, ELAM),其目的是通过引导模型关注伪装目标的边缘区域,提升检测精度和鲁棒性。如
针对植物伪装场景中光照变化与枝叶晃动导致的特征不稳定性,本文提出一种边缘强度驱动的动态迭代反馈机制。另外动态迭代反馈机制让网络在处理简单图像时能够高效运行,而在处理复杂图像时则能够进行更多次的迭代,从而获得更精确的特征表达。在实现上,首先将输入图像转为灰度图像 ,然后使用Sobel滤波器提取图像的边缘信息。边缘信息的计算通过对灰度图像进行水平和垂直方向的边缘检测,得到并通过平方和开根号的方式计算图像的边缘强度 。然后通过对边缘强度的均值进行计算得
到当前图像的复杂度,计算方式如下: 接下来,根据当前图像的复杂度系统会动态调整迭代次数: 每次迭代中,特征图与之前迭代的输出进行相加,形成新的输入。
这种反馈机制使得网络能够根据前一次迭代的结果进行调整,从而逐步改进特征图的表达。通过引入动态迭代反馈机制,网络能够在复杂背景和动态变化的场景下,自动适应不同图像的复杂度,提升检测精度的同时,保持计算效率。这种灵活的计算过程使得模型能够在各种环境中表现出更强的鲁棒性,特别适用于植物伪装检测任务中的复杂场景。
我们使用由Yang等人最新构建的PlantCamo数据集
我们采用了四种常见的评估指标,分别是Structure-measure (
)
我们的模型使用PyTorch框架进行实现,并在两张NVIDIA GeForce RTX 3090 GPU上进行加速。在训练过程中,我们使用来自PlantCAMO-train的1000张伪装植物图像作为训练集。为了提高训练的泛化能力,我们对输入图像进行了数据增强操作,包括将图像分辨率调整为702 × 702,并应用了随机水平翻转策略。我们采用了Adam优化器,设置批次大小(batch size)为8,epoch为100,学习率设置为 ,衰减率为0.1。
Model |
↑ |
↑ |
↑ |
↓ |
SINet
|
0.766 |
0.842 |
0.583 |
0.066 |
ZoomNet
|
0.798 |
0.874 |
0.680 |
0.049 |
SINet-V2
|
0.801 |
0.873 |
0.678 |
0.050 |
BGNet
|
0.786 |
0.873 |
0.552 |
0.076 |
HitNet
|
0.854 |
0.929 |
0.794 |
0.034 |
PCNet
|
0.880 |
0.937 |
0.818 |
0.028 |
MFENet (Ours) |
0.886 |
0.939 |
0.816 |
0.028 |
为了证明模型的有效性,我们对MFENet与其他通用COD方法以及专门用于植物伪装检测任务的PCNet进行比较,实验结果如
为验证本文所提模块的有效性,我们在PlantCamo数据集上进行了系统的消融实验,分别测试SAFS模块、CAEA模块、ELAM模块及动态迭代机制对模型性能的影响。首先删除所有模块作为基准模型,随后依次在模型中添加SAFS模块、CAEA模块、ELAM模块。实验结果见
SAFS |
CAEA (no ELAM) |
ELAM |
↑ |
↑ |
↑ |
↓ |
0.862 |
0.925 |
0.790 |
0.034 |
|||
√ |
0.877 |
0.931 |
0.808 |
0.031 |
||
√ |
√ |
0.880 |
0.936 |
0.814 |
0.030 |
|
√ |
√ |
√ |
0.886 |
0.939 |
0.816 |
0.028 |
Iteration times |
↑ |
↑ |
↑ |
↓ |
iter = 1 |
0.879 |
0.927 |
0.808 |
0.032 |
iter = 2 |
0.884 |
0.939 |
0.812 |
0.029 |
iter = 3 |
0.880 |
0.934 |
0.814 |
0.030 |
Dynamic |
0.886 |
0.939 |
0.816 |
0.028 |
本文提出一种新的植物伪装检测模型MFENet,设计的主要思想是通过SAFS模块的多尺度频率分离策略处理低信噪比问题,以让网络更好地感知目标整体结构,通过CAEA模块提高网络对微小边缘特征的敏感性。实验结果显示,本文提出的MFENet在PlantCamo数据集上表现明显优于通用COD模型,与专用于植物伪装的PCNet相比也有一定提升。尽管如此,在极端低信噪比的场景下,模型仍然存在细微的检测误差,未来的研究可以从多模态数据融合,三维形态感知增强、跨任务迁移与自监督学习等方面展开,以进一步提升模型性能。
*通讯作者。