极速滚球-beplay滚球玩法刺激-beplay体育官网网页版等您来挑战！

CSA

Computer Science and Application

2161-8801

Scientific Research Publishing

10.12677/CSA.2022.129218

CSA-56127

CSA20220900000_73170310.pdf

信息通讯

融合多尺度特征和注意力机制的成矿预测研究 Study on Metallogenic Prediction Combining Multi-Scale Features and Attention Mechanism

周

澍

² ¹ 张

鑫

² ¹ 高

乐

² ¹

五邑大学智能制造学部，广东江门

null

06 09 2022

12 09 2146 2160

2014

This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

当前成矿预测方法主要是基于地球物理、地球化学等手段来对成矿远景区进行标记。然而现实世界中成矿是稀有的地质事件，而且对矿点进行标记需要耗费大量的人力物力资源。为了解决传统方法的不足，本文提出了一种新颖的智能找矿框架——MFA Framework。具体地，首先定义MFCANet、SACNet两个网络。在此基础上，通过多尺度特征提取不同地球化学元素的特征。其次，引入通道注意力模块根据特征元素重要性赋予不同的权重，最终引入空间注意力模块解决特征图中不同空间位置对成矿影响程度不同的问题。并通过共享的全连接层和Voting模块最终确定有无矿点。通过在地球化学数据集上进行实验，大量实验表明本文所提模型相比主流方法具有显著的竞争力。 The current metallogenic prediction method is mainly based on geophysical and geochemical means to mark the metallogenic prospect area. However, mineralization is a rare geological event in the real world, and marking the ore occurrence requires a lot of human and material resources. In order to solve the shortcomings of traditional methods, a novel intelligent prospecting framework MFA Framework is proposed in this paper. Specifically, MFCANet and SACNet are defined first. On this basis, the characteristics of different geochemical elements are extracted through multi-scale features. Secondly, the channel attention module is introduced to give different weights according to the importance of feature elements, and finally the spatial attention module is introduced to solve the problem of different spatial positions in the feature map having different effects on mineralization. Through the shared full connection layer and the voiting module, the presence or absence of mining points is finally determined. Through experiments on geochemical data sets, a large number of experiments show that the proposed model is significantly competitive with the mainstream methods.

多尺度特征网络，注意力机制，成矿预测, Multiscale Feature Network Attention Mechanism Metallogenic Prediction

摘要

关键词

多尺度特征网络，注意力机制，成矿预测

Study on Metallogenic Prediction Combining Multi-Scale Features and Attention Mechanism<sup> </sup>

Shu Zhou, Xin Zhang, Le Gao^*

Department of Intelligent Manufacturing, Wuyi University, Jiangmen Guangdong

Received: Aug. 16^th, 2022; accepted: Sep. 15^th, 2022; published: Sep. 22^nd, 2022

ABSTRACT

The current metallogenic prediction method is mainly based on geophysical and geochemical means to mark the metallogenic prospect area. However, mineralization is a rare geological event in the real world, and marking the ore occurrence requires a lot of human and material resources. In order to solve the shortcomings of traditional methods, a novel intelligent prospecting framework MFA Framework is proposed in this paper. Specifically, MFCANet and SACNet are defined first. On this basis, the characteristics of different geochemical elements are extracted through multi-scale features. Secondly, the channel attention module is introduced to give different weights according to the importance of feature elements, and finally the spatial attention module is introduced to solve the problem of different spatial positions in the feature map having different effects on mineralization. Through the shared full connection layer and the voiting module, the presence or absence of mining points is finally determined. Through experiments on geochemical data sets, a large number of experiments show that the proposed model is significantly competitive with the mainstream methods.

Keywords:Multiscale Feature Network, Attention Mechanism, Metallogenic Prediction

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

矿产资源是支撑国民经济发展的基石，也是国家安全的保障。由于中国的经济不断发展，我国的重大基础设施工程中对矿产资源的需求量也愈来愈大 [ 1 ]，加速矿产资源的开发已经刻不容缓。同时，随着计算机技术的进步，将人工智能引入地球科学领域来代替传统的地球化学找矿方法已经成为了新的发展趋势 [ 2 ]。

当前很多学者使用传统的机器学习方法来进行矿靶区预测，例如左仁广 [ 3 ] 使用SVM算法对加拿大西部的Nova Scotia金矿床进行预测，通过对比证据权法，发现SVM算法对矿点分布预测的准确度和精度上都有很大提升。Mehrdad [ 4 ] 使用遗传算法来优化随机森林的超参数以提升其预测矿靶区的准确度。林楠 [ 5 ] 利用逻辑回归算法，综合地球物理、地球化学等数据构建了青海拉陵灶火地区的成矿预测模型。Marjanovic [ 6 ] 等人分别使用了机器学习中的人工神经网络、回归树、随机森林等算法对矿区进行了成矿预测，并对预测结果进行了比较全面的对比与评估。

虽然学者们在地球化学成矿预测中使用传统机器学习算法进行了大量的实验研究，但由于成矿信息具有多源、多模式的特点，而且地球化学数据往往矿点稀少且特征细微，给分类和预测带来了更大的挑战，使得传统的机器学习算法难以很好地执行 [ 7 ]。近些年，使用深度学习来进行成矿预测成为了研究的热点。

许多深度学习方法被用来解决地球化学成矿预测问题 [ 8 ] [ 9 ] [ 10 ]。这些方法包括CNN (卷积神经网络)、DBN (深层信念网络)、多层LSTMN (长–短期记忆网络)、GAN (生成对抗网络)和转移学习 [ 11 ]。深层CNN可以从训练数据中自动学习地球化学图像分类所需的特征，从而提高分类精度和效率，而无需依靠人工特征选泽 [ 12 ]。在地球化学领域，基于地球化学数据的找矿预测已成为一个活跃的研究领域。近年来，深度学习在地球化学数据分析和找矿预测中的应用越来越受到关注 [ 13 ]。例如，根据从中国东部福建省西南部采集的39个沉积物样品的地球化学数据，左仁广使用深度AEs网络识别与矽卡岩型铁多金属矿化相关的地球化学异常 [ 14 ]。大量研究表明，由深度学习方法支持的地球化学数据分析是识别与矿化相关的多元素地球化学异常的有力工具 [ 15 ]。深度学习依赖于拥有大量的训练数据，在应用深度学习进行找矿预测的过程中，需要将已知矿床的地球化学特征作为训练数据。为了解决深度学习的小样本、数据数量问题，提出了许多方法，包括数据增强、正则化、元学习和度量学习 [ 16 ]。数据增强方法已应用于图像识别，包括随机裁剪、旋转、翻转、仿射变换和其他图像变换，以生成训练数据集，这意味着有限的原始数据可以产生更多用于训练目的的数据。

为了解决当前深度学习智能预测矿靶区存在的特征细微、样本不平衡等问题，本研究的主要贡献如下：1) 针对地球化学数据矿点稀少、样本极其不均衡的情况，采用Smote算法对有矿样本进行扩充，保证输送到神经网络的数据达到平衡，极大提升了模型训练的准确度。2) 开发了一种智能化地球化学找矿预测方法——融合注意力机制和多尺度特征的方法，并提出了MFA Framework框架。该框架针对地球化学数据特征细微的情况，采用多尺度特征来提取更多的特征信息。针对矿点稀少的情况，采用不同卷积核大小的膨胀卷积来生成更多的样本数据。考虑到不同地球化学元素对成矿的影响程度不一样，引入通道注意力机制，对不同通道的特征元素赋予不同的权重。考虑到不同空间位置的元素对成矿影响程度不一样，引入空间注意力机制生成不同空间位置的权重，提升智能预测找矿框架的准确度。为提升模型的训练速度，减少需要训练的参数量，为不同的通道使用共享的全连接层，加快模型的收敛。

2. 相关工作 2.1. 多尺度特征学习

多尺度特征学习通常使用不同的数据方式，以及不同规格的卷积核完成图像数据获取，进而对得到的各种尺度的图像进行分类，最终使用分类算法实现不同的图像分类任务。当前，已经有不少研究者针对多尺度特征学习在图像识别技术应用领域中开展了大量研究 [ 17 ] [ 18 ] [ 19 ]。Alexey [ 20 ] 引入了Neck模块，该模块通过将自顶向下和自底向上两种方式相结合，对不同尺度的特征进行融合来提升语义和空间表达能力。Zhang [ 21 ] 使用Tansformer结构实现跨尺度特征融合以丰富上下文信息。Li [ 22 ] 通过定义一个沿着卷积层中输入和输出通道方向进行周期变化的膨胀卷积系数集合，以整齐的样式聚集不同尺度特征。DeeplLab [ 23 ] 使用不同尺寸的卷积核进行卷积操作，最终得到不同尺度特征的图像。

2.2. 通道注意力机制

在深度学习领域中，Attention机制是一种资源的分配机制，可以认为是对原本神经网络平均分配的资源根据特征信息的重要性程度进行重新的权重分配，这样使得神经网络的模型训练集中在重要的特征上，提升神经网络的效率和准确度。2018年，CVPR收录的论文中首次提出了SE-Net (通道注意力机制)的概念，该团队在2017年利用SE-Net获得了ImageNet图像分类竞赛的冠军 [ 24 ]。当前已经有很多学者进行了大量研究，并取得了很好的效果如文献 [ 25 ] [ 26 ]。X. Yang [ 27 ] 提出了一种结合空间注意机制和通道注意机制的CNN模型，以实现对野外图像的准确定位和识别。Y. Cheng [ 28 ] 为了解决文本情感分析领域文本前后之间的依赖关系，提出了基于多通道CNN和具有双向GRU的文本情感分析模型，并在MDB数据集和Yelp 2015数据集上都取得了很好的效果。W. Tong [ 29 ] 提出了一种用于遥感图像场景分类的基于通道注意力的DensNet网络。

2.3. 空间注意力机制

不是图像中所有的区域对任务的贡献度都是一样的，只有任务的相关区域才是最需要关注的。比如在分类任务中，空间注意力模块就是寻找网络中最重要的部位进行处理。在地球化学成矿预测中，考虑到不同空间位置的元素对成矿影响存在差异性，引入空间注意力模块是非常有必要的。当前已经有许多学者将空间注意力模块引入网络模型中，来改进模型的训练效果如文献 [ 30 ] [ 31 ]。张连超 [ 32 ] 为了获取到特征图中不同特征点之间的长距离依赖关系，使得卷积神经网络更好地区分前景目标和背景信息，提出了一种具有全局特征的空间注意力模块。张丹璐 [ 33 ] 提出一种结合空间注意力和通道注意力的孪生网络目标跟踪方法，增加了孪生网络对目标的判别能力，改善了SiamFC在复杂背景下跟踪效果不佳的问题。

3. 方法

如图1所示，MFA Framework主要是由两个部分组成，分别是MFCANet、SACNet。MFCANet使用了一个膨胀系数的集合 α = { α 1 , α 2 , α 3 , ⋯ , α n } 和一个通道注意力机制SE-Net模块。主要包含两个步骤：1)使用膨胀系数集合α生成不同尺度的卷积核，得到不同尺度特征图以解决矿区数量少的问题，也帮助后面的卷积操作提取到这个区域更多更细微的特征信息。2) 对于膨胀卷积后生成的特征图首先经过一个通道注意力模块，该模块主要包括压缩和激烈两个过程。压缩阶段通过在特征图上进行全局池化得到全局压缩特征量。激烈阶段通过两层全连接的bottleneck结构得到Feature Map中每个通道的权值，并将加权后的Feature Map作为下一层网络的输入。由此对提取的特征进行重标定，为不同通道上的特征赋予不同的权重值 W = { W 1 , W 2 , ⋯ , W n } ，解决不同地球化学元素对成矿影响程度存在差异的问题。CCANet模块主要包括一系列的卷积操作，考虑到特征图中不同空间位置的元素含量对成矿影响不同，在最后一层卷积加上空间注意力模块，对不同位置的特征赋予不同的权重系数，为了减少训练参数量、加速模型收敛，最终各个通道采用共享的全连接层进行分类。

图1. Multiscale feature attention framework流程图

3.1. 问题定义

本文首先对原始的地球化学数据集使用传统的插值法——反距离权重法，通过该方法得到其对应的元素含量富集图。然后，定义一个滑动窗口选择合适的步长在生成的含量图上进行滑动，得到各个采样点的特征元素含量，用来制成最终所需的数据集。地球化学训练集 D = { ( x i , y i ) } i = 1 N 包含N个样本，其中 x i ∈ R c 为其中的各种特征元素， y i ∈ ( 0 , 1 ) 为其对应的真实标签。C为地球化学元素的通道数，其中0代表“无矿”数据，1代表“有矿”数据。为解决地球化学数据特征细微其数据分布不均衡的问题，模型设计如下。

3.2. Multiscale Feature Channel Attention Mechanism Mapping Network

MFCANet的作用如下：先通过不同尺度特征的卷积核进行膨胀卷积，得到不同尺度特征的元素含量图。然后引入通道注意力机制，对不同通道上面的特征元素赋予不同的权重，解决不同特征元素对成矿预测影响不同的问题，提升整个智能预测找矿框架的准确率。

3.3. 多尺度特征图生成

针对地球化学数据集中矿点稀少的问题，可以使用不同膨胀尺寸的卷积操作来生成不同尺度的特征图，增加数据样本的多样性。对于输入的地球化学特征元素集合 x ′ = { x i } i = 1 N ，可以采用膨胀系数集合 α = { α 1 , α 2 , α 3 , ⋯ , α n } 生成不同大小的卷积核对其进行卷积操作，生成不同尺度特征的元素特征图。具体地，使用卷积核 W = { W 1 , W 2 , ⋯ , W n } 和膨胀系数的集合α进行卷积操作得到多尺度特征图 P = { P 1 , P 2 , ⋯ , P n } ，其中第i个特征图为P_i。具体的生成公式如下所示：

P i = r ( x i , W i , α i ) (1)

其中X_i代表第i个特征元素，W_i代表生成第i个特征图对应的卷积权重，α_i代表生成第i个特征图对应的膨胀卷积系数。

3.4. SE通道注意力模块

一个区域的成矿前景是由多种元素共同作用的结果，不是由单一元素来决定的，不同的元素对成矿的影响程度不一样。由此引入通道注意力模块，根据loss的值，反向动态的调整不同通道上的权重值，增加重要特征的权重值，抑制影响小的特征的重要性，提高网络模型的表征力。SE通道注意力模块主要由特征压缩、特征提取、权重分配三个部分组成。对于输入的地球化学特征元素集合 x ′ = { x i } i = 1 N ，通过膨胀卷积生成不同尺度的特征图 P = { P 1 , P 2 , ⋯ , P n } 。对于多尺度特征变换后生成的特征图P，其维度为 P W × H × c ，W和H表示元素含量图的宽度和高度，C表示特征元素个数即通道数。对特征P经过两个3 × 3的卷积操作，其步长为1，0填充的数量为1。经过两个特征提取模块，输出的特征图为P1，其维度仍然保持不变。在压缩部分，通过全局的平均池化来压缩特征图P上通道的特征信息，这对于卷积操作捕获全局的特征信息是很有利的。特征压缩部分输出的特征图为Y，其维度为 Y W × H × 1 ，将Y经过3 × 3的卷积操作输出Y1，Y1和Y一样的形状。特征图Y1过的输出和特征图P1进行相乘操作，为特征图的各个通道重新分配权重值。通过Loss的值反向来调整通道的权重值，通过为各个通道赋最合适的权重值，加速模型的收敛，提高智能找矿预测框架的准确度。具体的SE-Net模块的设计思想如图2所示。

图2. 通道注意力模块流程图

3.5. Spatial Attention Convolution Classification Network

SACNet的作用如下：通道注意力是为处于不同通道的特征赋予不同的权重，加强重要通道特征对模型训练的影响，降低或忽略非重要信息的通道。与通道注意力不同，可以使用空间注意力作为卷积操作的补充，其作为一种可学习的权重分配机制，可以用来对不同位置的特征进行增强或抑制。SACNet在卷积操作之后引入空间注意力模块，对一系列卷积操作之后所得到的中间特征元素信息，根据其不同位置的影响力不同，动态生成权重值，根据对成矿影响的不同做相应的增强或抑制。最后，通过共享的全连接层和SoftMax激活函数进行二分类，对于有矿或无矿，引入Voting机制进一步预测，提升模型预测的准确度。

3.6. 空间注意力模块

对于输入的地球化学特征元素集合 x ′ = { x i } i = 1 N 经过多尺度特征提取、通道注意力模块和一系列的卷积操作以后，生成的特征图定义为 F = R H × w × C ，将其作为通道注意力模块的输入。使用两个1 × 1的卷积核对通道进行加权求和，生成两个二维的特征元素图： P 1 S ∈ R H × W × 1 和 P 2 S ∈ R H × W × 1 ，接着沿着通道维度将两个特征图连接起来，并再次对其进行卷积操作来生成单个通道的空间位置的权重分布图 P s ( F ) ∈ R H × W × 1 ，该特征图可以根据模型训练的需要，不断调整权重值，最终对元素含量图中不同空间位置的特征分配权重系数。具体的计算方法如下所示：

P s ( F ) = ∅ ( Conv 3 ( Concat ( Conv 1 ( F ) , Conv 2 ( F ) ) ) (2)

= ∅ ( Conv 3 ( Concat ( P 1 S , P 2 S ) (3)

其中，Conv1(*)和Conv2(*)表示两个1 × 1的卷积层，Conv3(*)表示一个7 × 7的卷积层Concat(*)表示空间维度之间做的拼接操作， ∅ 表示Sigmoid激活函数。空间注意力模块具体设计思想如图3所示：

图3. 空间注意力模块流程图

3.7. 共享的全连接层进行分类预测

对多尺度特征提取之后的不同尺度的特征图接着在不同通道上进行进一步特征提取，并通过共享的全连接层得到分类结果。对于输入的地球化学特征 X = { x i } i = 1 N 通过不同系数的膨胀卷积进行多尺度特征提取可以得到其特征图的集合 P = { p 1 , p 2 , p 3 , ⋯ , p k } ，其中 P i = { P j i } j = 1 N 。SACNet的网络首先对P进行特征提取，接着进行全局的池化操作，然后经过空间注意力模块为不同位置分配不同权重，最后通过共享的全连接层得到其输出结果。使用最优化交叉熵的方式来优化分类模型的网络结构，如公式(4)所示。另外，在Softmax之后，加入Voting 机制来整合每个网络的输出结果，得到最终的有矿无矿预测信息。

L = ∑ i = 1 M ∑ j = 1 N l o s s ( ∂ i ; P j i ; y i ) (4)

其中， ∂ i 是SACNet中的权重参数，y_i是第i个地球化学特征元素的标签值，loss(*)是Softmax激活后再进行交叉熵损失计算。

3.8. Voting模块

SACNet参考MFI-Framework [ 34 ] 结构，在SoftMax后加入Voting模块，通过对各个通道网络使用SoftMax运算后的概率分布进行投票来得到最终的预测结果，实验证明比起仅使用共享的全连接分类有更好的效果。具体地，SACNet使用SoftMax运算后的概率分布为 P = { P i } i = 1 k ， P i = [ P 0 , P 1 ] ，其中 P 0 为预测为“无矿”的概率， P 1 为预测为“有矿”的概率。首先通过公式(5)得到各个通道网络的预测结果，再通过公式(6)投票确定最终的预测结果。

y ^ i = argmax ( P i ) (5)

y ^ = vote ( { y ^ i } i = 1 k ) (6)

4. 实验 4.1. 关键特征元素的选择

实验数据来源于研究区中提取的地球化学元素，从该区域测量样品分析Ag、As、Au、Ba、Bi、Cd、Co、Cr、Cu、Hg、Mo、Ni、Pb、Sb、Sn、V、W、Zn等18种化学元素。图4为实验区的地质简图，红点为矿区。表1为部分原始数据，X，Y为采样点坐标为地球化学元素含量。从16种地球化学元素中选取影响矿区形成的关键化学元素。

Table 1 Dataset of metallogenic mapping in the study are

X	Y	AU	B	SN	CU	AG	BA	MN	PB	ZN	AS	SB	BI	HG	MO	W	F
422.24	2418.80	0.9	3	8.7	4	0.025	33	147	27	26	1.17	0.31	0.23	0.04	2.67	0.79	212
421.68	2418.65	0.67	3	1.66	2	0.068	206	84	17	27	0.42	0.25	0.08	0.03	0.73	1.01	408
422.16	2418.30	1.17	4	3.09	7	0.05	770	223	45	42	1.02	0.38	0.27	0.09	0.64	6.11	309
421.31	2419.30	0.71	6	1.42	13	0.04	59	216	10	26	2.68	0.37	0.35	0.04	3.19	1.92	177
421.37	2418.80	0.54	4	2.56	7	0.078	88	209	12	23	0.9	0.29	0.13	0.04	0.82	1.16	204
421.13	2418.25	0.81	3	3.74	5	0.06	885	305	33	22	0.58	0.36	0.8	0.04	0.82	1.11	252
421.37	2417.85	0.94	4	2.41	5	0.086	797	267	53	35	1.15	0.34	0.47	0.09	0.51	1.16	252
419.76	2418.25	0.81	3	1.52	5	0.043	1111	423	42	14	0.51	0.35	0.06	0.07	0.59	0.38	101
420.12	2418.40	0.37	2	1.65	6	0.046	941	498	38	17	0.53	0.31	0.1	0.02	0.57	0.33	111
420.55	2418.60	1.09	4	1.53	8	0.033	427	338	37	29	0.74	0.28	0.09	0.07	1.68	0.73	186
420.57	2418.25	0.6	4	2.21	4	0.04	512	695	21	12	0.45	0.29	0.05	0.01	0.84	0.43	72
420.30	2418.75	0.79	2	1.71	5	0.043	800	454	39	13	0.45	0.27	0.08	0.02	0.53	0.4	84
420.32	2419.15	0.48	3	2.87	6	0.07	1121	312	62	38	0.55	0.31	0.2	0.05	0.48	0.68	261
420.52	2419.10	0.78	6	2.67	5	0.058	1327	621	27	23	0.43	0.37	1.77	0.02	0.56	0.65	129
420.33	2419.60	0.82	3	4	5	0.053	1859	446	49	61	0.88	0.38	0.47	0.06	1.02	0.87	423

表1. 研究区成矿出图数据集

图4. 研究区成矿地质简图

地球化学元素总共有18种，如果全部制成图像用来训练模型，效果不会很好，而且整个训练过程也会变得很复杂。针对这种情况，本文先采用主成分分析的方法对数据进行降维，保留大部分的特征信息，将降维后的数据用于模型的训练。主成分实验参考戴亮亮 [ 35 ] 对低山丘陵区土壤数据集处理方法，具体操作如下：将主成分的比重系数设置为0.94，选择保留原始地球化学数据集94%的特征信息，最终通过降维，得到了8个主成分，其中前三个主成分所占比重分别为28.12%，23.14%，21.56%。为保证特征元素含量图的效果，方便后续的神经网络训练，将降维后的数据进行100~200之间的归一化处理，最终得到的8个主成分数据的部分展示如下表2所示：

Table 2 8 characteristic data after dimension reductio

第一特征	第二特征	第三特征	第四特征	第五特征	第六特征	第七特征	第八特征	经度	纬度
115.4629	127.3196	126.7207	141.8333	146.1261	126.5084	144.6306	122.4888	703360	2712193
118.7981	127.0876	129.4594	140.2511	145.6059	128.5589	142.9687	124.1196	703840	2712147
118.7887	128.0429	129.9679	142.8998	148.5748	127.3214	143.9545	123.0766	704459	2712232
118.493	126.6673	129.0675	140.487	145.8058	128.6403	143.9668	124.7701	704862	2712041
114.8237	127.9848	129.1128	145.9009	143.7591	125.5657	145.6061	122.5559	705884	2712077
126.0983	127.3737	137.1607	142.5045	142.8509	132.871	145.2982	121.935	706047	2712027
120.0823	127.4144	132.8431	145.6622	142.9586	128.6249	145.2774	120.7957	706459	2712016
119.4928	128.4325	130.777	148.0005	146.1801	125.8703	142.1309	126.6536	707160	2712229
134.4155	125.4373	130.7115	139.3374	139.6563	129.1729	147.7383	126.4343	707349	2712373
149.3664	123.8043	137.3001	149.309	138.3371	128.3513	141.8872	125.1072	707506	2712140
155.844	120.9954	137.4262	141.6192	146.4467	132.2519	147.0643	125.2997	708414	2712270
125.0931	126.1306	130.4187	138.3427	142.9182	130.8634	150.7498	123.1811	708779	2712251
158.3804	121.6926	136.3188	144.362	150.4861	130.0957	150.1166	124.5385	709390	2712183
165.9074	119.355	134.6522	135.875	146.4667	131.8721	150.1879	127.0134	709829	2712011

表2. 降维后的8种特征数据

4.2. 数据预处理

实验参考郑泽宇 [ 36 ] 对水系沉积物数据的处理方法，对使用主成分分析降维后的地球化学数据使用反距离权重插值法来生成对应的元素含量富集图。生成W × H网格点的含量图，其中W是该图的宽度，H是高度。最终得到C个W × H的网格图，其中C是降维后的主成分个数。反距离权重法的计算公式如下所示：

D j = ( x 0 − x j ) 2 + ( y 0 − y j ) 2 (7)

Z ( x 0 , y 0 ) = ∑ j = 1 N 1 ( D j ) 2 (8)

其中， D j 为采样点到网格点(x₀, y₀)的欧式距离， Z ( x 0 , y 0 ) 为对该位置的估值， Z i 为该位置采样点的实际值，N为需要跟该网格点计算距离的采样点个数。

最终，对经过反距离插值处理后的数据，根据其经纬度坐标和其特征值，生成实验所需要的图像数据集。对每种特征元素都根据反距离权重法生成1560 × 1560的特征元素含量图，总共8个特征元素含量图。如图5所示，就是其中八个特征图。对特征元素图进行处理，实验采用128 × 128的窗口和128的像素大小在含量图上进行滑动操作，生成最终模型训练需要用到的地球化学数据集。训练集共546个数据，其中86个为“矿”数据，“无矿”数据为 460个；测试集含96个数据，其中18个为“矿”数据，“无矿”数据为78个。从中可以看出数据样本分布及其不均衡，有矿数据远远大于无矿数据。针对当前数据存在的情况，实验采用Smote算法来对样本数据进行扩充，以此增加更多的有矿数据，是的数据达到平衡。并同时添加均值为0，方差为0.01的高斯噪声对数据进行增强处理。根据Smote算法以及数据增强的方法将原来的含矿样本从104个扩充到了416个，使得更多的非矿点能加入模型的训练，增强了其完备性。最终生成的数据集中训练集共780个数据，其中368个为“矿”数据，“无矿”数据为 412个；测试集含201个数据，其中98个为“矿”数据，“无矿”数据为102个。数据样本达到了平衡，可以用于模型的训练。将8中特征的网格图整合到一起，如图5所示，即最终数据集中有981个128 × 128 × 8的数据。将其作为MFA-Framework框架的输入。

4.3. 基于MFA Framework的实验

本实验平台选择Tesla v100 32GB GPU，使用的深度学习框架为Pytorch。对从研究区成矿数据集中提取的主要特征制成的数据集进行不同结构的实验研究。模型的评价指标使用准确度、召回率、AUC值、和F1-Score。

图5. 8种特征元素含量图

本实验以ResNet18 [ 37 ] 和shufflenetV2 [ 38 ] 为基础，采用MFA-Framework对其进行优化，以此证明本文所以的MFA-Framework框架良好的泛化能力，并且与主流的深度学习模型进行对比实验。使用SGD优化器来迭代实验模型，其动量为0.2，权重衰减为1e−4，循环迭代220次，初始学习率设置为0.02，每30次衰减40%，批量大小为32。本文MFA-Framework所使用的 α = { α 1 , α 2 , α 3 , ⋯ , α n } 参考MFI Framework [ 34 ] 网络，将膨胀系数设置为α = {1, 6, 12, 18, 24}。

表3是引入MFA-Framewok后的实验结果，从表中的数据可看出，基于resnet18优化的模型比原先的resnet18性能获得了很大的提升，准确率提升了7.79%，AUC值提升了10.13%，召回率提升了10.86%，F1-Score值提升了4.09%。基于shufflenetV2优化的模型相比原先的shufflenetV2性能也存在提升，准确率提高了3.97%，AUC值提高了3.7%，召回率提高了17.65%，F1-Score提高了8.44%。证明了MFA-Net框架具有良好的泛化性，相比流行的框架具有一定的优势，特别在resnet18上效果获得了很大的提升。在用MFA-Framework对resnet18优化后，AUC和召回率提升非常明显，证明了该框架确实对成矿预测有效，特别是对有矿数据的预测。

Table 3 Experimental result

方法	准确率	AUC	召回率	F1-Score
resnet18	64.85	63.23	31.50	59.42
resnet18*	72.64	73.36	42.36	63.51
shufflenetV2	62.47	61.42	18.47	54.68
shufflenetV2*	66.44	65.12	36.12	63.12
GoogleNet	62.38	61.45	20.14	56.33
MobileNetV2	64.23	64.13	16.23	58.36
MnasNet	68.79	67.23	17.69	60.86

表3. 实验结果

*为基于MFA-Framework优化后的模型，下同。

4.4. 消融实验

MFA-Framework通过不同系数生成不同尺寸的卷积核，通过不同的卷积核进行卷积操作来生成多个尺度的特征图。通过这种方法可以增加样本的多样性，解决当前成矿预测中地球化学数据样本少的问题。同时，因为不同的地球化学元素对成矿的影响程度是不一样的，针对这种情况，引入通道注意力机制，动态调整不同通道的权重值，提升找矿的性能。为了验证本文所提框架对解决这些问题的有效性，针对共享的全连接层、膨胀卷积、通道注意力机制、空间注意力机制进行实验，并基于resnet-18的结构进行改进。

实验结果如表4所示，从中可以看出使用共享的全连接层、通道注意力等模块对解决地球数据现存的样本少、特征细微等问题确实有效。其中影响最大的是膨胀卷积操作，当不使用该模块的时候，准确度下降很多。其次，使用通道注意力模块对预测结果的提升也比较明显。

Table 4 Experimental results based on shared full connection layer, expansion convolution, channel attention mechanism and spatial attention mechanis

方法	准确率	AUC	召回率	F1-Score
不使用共享全连接层	70.22	69.78	31.22	55.69
不使用膨胀卷积	66.64	65.41	41.22	56.34
不使用通道注意力模块	69.56	64.88	34.56	58.66
不使用空间注意力模块	71.36	70.34	37.22	60.12

表4. 基于共享的全连接层、膨胀卷积、通道注意力机制、空间注意力机制的实验结果

4.5. 基于通道注意力模块实验

为了探讨MFA-Framework中通道注意力模块的影响，基于通道注意力模块进行实验研究。对resnet18*和shufflenetV2*增加个不使用通道注意力模块的实验，定义为no-se-resnet18*和no-se- shufflenetV2*。其实验结果如表5所示，resnet18*和不使用通道注意力模块的resnet18*相比，准确度提升3.08%，AUC值提升8.48%，F1-Score提升4.85%。而shufflenetV2*相比no-se-shufflenetV2*准确度提升3.0%，AUC值提升1.96%，F1-Score提升1.88%。

Table 5 Experimental results of channel based attention modul

方法	准确度	AUC	召回率	F1-Score
resnet18*	72.64	73.36	42.36	63.51
no-se-resnet18*	69.56	64.88	34.56	58.66
shufflenetV2*	66.44	65.12	36.12	63.12
no-se-shufflenetV2*	63.44	63.16	35.46	61.24

表5. 基于通道注意力模块实验结果

4.6. 基于空间注意力模块实验

为了探讨MFA-Framework中空间注意力模块的影响，基于空间注意力模块进行实验研究。对resnet18*和shufflenetV2*增加个不使用空间注意力模块的实验，定义为no-sp-resnet18*和no-sp-shufflenetV2*。其实验结果如表6所示，resnet18*和不使用空间注意力模块的resnet18*相比，准确度提升1.41%，AUC值提升1.48%，F1-Score提升1.87%。而shufflenetV2*相比no-se-shufflenetV2*准确度提升1.46%，AUC值提升0.96%，F1-Score提升0.88%。

Table 6 Experimental results based on spatial attention modul

方法	准确度	AUC	召回率	F1-Score
resnet18*	72.64	73.36	42.36	63.51
no-sp-resnet18*	71.23	71.88	39.66	61.64
shufflenetV2*	66.44	65.12	36.12	63.12
no-sp-shufflenetV2*	64.98	64.16	35.22	62.24

表6. 基于空间注意力模块实验结果

4.7. 基于辅助损失函数系数实验

为了探究损失函数的系数对MFA-Framework的影响，本次实验设置的辅助损失函数系数为0.4。另外设置四组实验，其中的系数分别为{0.8, 0.6, 0.5, 0.1}，并基于resnet-18结构进行优化。表7是基于辅助损失函数系数进行实验的结果，从表中可以看出，使用不同辅助损失函数的实验效果都优于resnet18。辅助函数系数为0.4时候，整体效果是最好的。当系数设置为0.6后，随着系数增大，反而效果变差了。

Table 7 Experimental results based on auxiliary loss function coefficien

系数	准确度	AUC	召回率	F1-Score
0.1	71.24	70.26	39.22	60.24
0.4*	72.64	73.36	42.36	63.51
0.6	71.42	70.12	38.45	60.14
0.7	68.24	65.44	37.25	58.74
0.8	64.56	63.21	32.44	60.24

表7. 基于辅助损失函数系数实验结果

4.8. 基于膨胀系数实验

为研究膨胀系数对本文所提框架的影响，膨胀系数参考MFI Framework神经网络设置为{1, 6, 12, 18, 24}。为了探究膨胀系数对MFI Framework的影响，以6为基准每间隔2设置一组实验，共设置4组实验，膨胀系数分

为：rate1 = {1, 2, 4, 8, 10}，rate2 = {1, 4, 8, 12, 16}，rate3 = {1, 6, 12, 18, 24}，rate4 = {1, 8, 16, 24, 32}，并基于resnet-18结构进行优化。表8是基于膨胀系数进行实验的结果，从表中可以看出，本文消融实验所使用的膨胀系数rate3效果是最好的，从rate1到rate3随着膨胀系数变大，模型的各方面性能都在提升。但当达到rate4以后，模型的准确度和AUC等值反而降低了。这说明膨胀系数并不是越大越好，需要选择最合适的膨胀系数才能最大发挥模型的效率。

Table 8 Experimental results based on expansion coefficien

膨胀系数	准确度	AUC	召回率	F1-Score
rate1	63.55	62.12	32.89	50.44
rate2	67.24	66.12	38.23	61.24
rate3	72.64	73.36	42.36	63.51
rate4	70.23	68.88	31.41	55.66

表8. 基于膨胀系数实验结果

5. 结束语

本文针对矿靶区预测中特征细微、矿点稀少的问题，提出了一种智能的矿靶区预测框架——MFA Framework。该框架由两个部分组成，分别是MFCANet和SACNet。其中MFCANet主要负责多尺度特征图的生成，首先通过不同膨胀系数的卷积核进行多尺度特征的提取，以此来生成不同尺度的特征图，增加数据的多样性，解决样本数据过少的问题。然后引入通道注意力模块，对不同通道的特征元素赋予不同的权重值。因为在地球化学成矿预测中，不同的元素对成矿影响是不一样的。在MFCANet中，在一系列卷积操作之后，在最后一层卷积层，加入空间注意力模块，解决特征图中不同空间位置对成矿影响程度不一样的问题。MFCANet网络主要负责对多尺度特征图的进一步提取和预测，为了提升模型训练效率，减少需要训练的参数量，为各个通道使用共享的全连接层进行分类预测。最后通过Voting模块确定该位置有无矿点。

实验基于resnet-18和shufflenetV2结构进行优化，基于本文所提框架优化后的模型比原来模型的准确度、AUC值、F1-Score各方面都获得了提升。预测的效果也明显优于当前主流的深度学习模型。而且它兼容大部分的深度学习模型，都能用该框架进行优化。本文所提方法的泛化能力很好，有望在其他领域中发挥巨大作用。

基金项目

项目1：广东省自然科学基金，编号：18zxxt52。

项目2：2022江门市科技计划项目“基于机器学习的江门市土壤环境质量调查与风险评估”。

文章引用

周澍,张鑫,高乐. 融合多尺度特征和注意力机制的成矿预测研究Study on Metallogenic Prediction Combining Multi-Scale Features and Attention Mechanism[J]. 计算机科学与应用, 2022, 12(09): 2146-2160. https://doi.org/10.12677/CSA.2022.129218

参考文献

References 1

陆三明, 阮林森, 张赞赞, 等. 安徽省三稀矿产资源现状､成因类型及找矿潜力[J]. 安徽地质, 2020, 30(1): 14-17.

周永章, 左仁广, 刘刚, 袁峰, 毛先成, 郭艳军, 肖凡, 廖杰, 刘艳鹏. 数学地球科学跨越发展的十年: 大数据、人工智能算法正在改变地质学[J]. 矿物岩石地球化学通报, 2021, 40(3): 556-573+777.
https://doi.org/10.19658/j.issn.1007-2802.2021.40.038

Zuo, R. and Carranza, E.J.M. (2011) Support Vector Machine: A Tool for Mapping Mineral Prospectivity. Computers and Geosciences, 37, 1967-1975.
https://doi.org/10.1016/j.cageo.2010.09.014

Daviran, M., Maghsoudi, A., Ghezelbash, R., et al. (2021) A New Strategy for Spatial Predictive Mapping of Mineral Prospectivity: Automated Hyperparameter Tuning of Random Forest Approach. Computers & Geosciences, 148, Article ID: 104688.

林楠. 基于遥感地质与地球化学信息的成矿预测模型研究——以青海拉陵灶火地区为例[D]: [硕士学位论文]. 长春: 吉林大学, 2015.

Marjanovic, M., Kovacevic, M., Bajat, B., et al. (2015) Landslide Suscepti-bility Assessment Using SVM Machine Learning Algorithm. Engineering Geology, 123, 225-234.
https://doi.org/10.1016/j.enggeo.2011.09.006

Karpatne, A., Ebert-Uphoff, I., Ravela, S., Babaie, H.A. and Kumar, V. (2019) Machine Learning for the Geosciences: Challenges and Opportunities. IEEE Transactions on Knowledge and Data Engineering, 31, 1544-1554.
https://doi.org/10.1109/TKDE.2018.2861006

毕志伟, 王艳凯, 孙肖, 等. 西藏日土县巴工铅多金属矿(点)地质, 岩浆岩地球化学及成岩年代学特征研究[J]. 中国地质, 2020, 47(2): 497-515.

Cameron, E.M., Hamilton, S.M., Leybourne, M.I., et al. (2004) Finding Deeply Buried Deposits Using Geochemistry. Geochemistry: Exploration, Environment, Analysis, 4, 7-32.
https://doi.org/10.1144/1467-7873/03-019

de Caritat, P., Main, P.T., Grunsky, E.C., et al. (2017) Recognition of Geochemi-cal Footprints of Mineral Systems in the Regolith at Regional to Continental Scales. Australian Journal of Earth Sciences, 64, 1033-1043.
https://doi.org/10.1080/08120099.2017.1259184

Carranza, E.J.M. (2010) Geochemical Anomaly and Mineral Prospectivity Mapping in GIS. In: Handbook of Exploration and Environmental Geochemistry, Vol. 11, Amsterdam, Elsevier, 145-151.

Chawla, N.V., Bowyer, K.W., Hall, L.O. and Kegelmeyer, W.P. (2002) SMOTE: Synthetic Minority Over-Sampling Technique. Journal of Artificial Intelligence Research, 16, 321-357.
https://doi.org/10.1613/jair.953

马瑶, 赵江南. 机器学习方法在矿产资源定量预测应用研究进展[J]. 地质科技通报, 2021, 40(1): 132-141.
https://doi.org/10.19509/j.cnki.dzkq.2021.0108

Li, T., Zuo, R.G., Xiong, Y.H., et al. (2020) Random-Drop Data Augmen-tation of Deep Convolutional Neural Network for Mineral Prospectivity Mapping. Natural Resources Research, 30, 27-38.
https://doi.org/10.1007/s11053-020-09742-z

李苍柏, 范建福, 宋相龙. 深度学习在地质学上的应用[J]. 地质学刊, 2018, 42(1): 115-121.

Ding, Y., Du, Q.Z., Yasin, Q., Zhang, Q. and Liu, L.H. (2020) Fracture Prediction Based on Deep Learn-ing: Application to a Buried Hill Carbonate Reservoir in the S Area. Geophysical Prospecting for Petroleum, 59, 267-275. (In Chi-nese)

Li, D., Yao, A.B. and Chen, Q.F. (2020) Learning to Learn Parameterized Classification Networks for Scalable Input Im-ages. Proceedings of European Conference on Computer Vision, Glasgow, 23-28 August 2020, 19-35.

Yang, T.J.N., Zhu, S.J., Chen, C., et al. (2020) MutualNet: Adaptive ConvNet via Mutual Learning from Network Width and Resolution. Proceedings of Euro-pean Conference on Computer Vision, Glasgow, 23-28 August 2020, 299-315.
https://doi.org/10.1007/978-3-030-58452-8_18

Guo, C., Fan, B., Zhang, Q., et al. (2020) AugFPN: Improving Multi-Scale Feature Learning for Object Detection. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, 13-19 June 2020, 12595-12604.
https://doi.org/10.1109/CVPR42600.2020.01261

Bochkovskiy, A., Wang, C.-Y. and Mark, L.H.-Y. (2004) Yolov4: Optimal Speed and Accuracy of Object Detection.

Zhang, D., Zhang, H.W., Tang, J.H., et al. (2020) Feature Pyramid Transformer. Proceedings of European Conference on Computer Vision, Glasgow, 23-28 August 2020, 323-339.
https://doi.org/10.1007/978-3-030-58604-1_20

Li, D., Yao, A.B. and Chen, Q.F. (2020) PSConv: Squeezing Fea-ture Pyramid into One Compact Poly-Scale Convolutional Layer. Proceedings of European Conference on Computer Vision, Glasgow, 23-28 August 2020, 615-632.
https://doi.org/10.1007/978-3-030-58589-1_37

Chen, L.C., Papandreou, G., Kokkinos, I., et al. (2017) DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs. IEEE Transactions on Pattern Analysis and Machine Intelligence, 40, 834-848.
https://doi.org/10.1109/TPAMI.2017.2699184

Hu, J., Shen, L. and Sun, G. (2018) Squeeze-and-Excitation Networks. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, 18-23 June 2018, 7132-7141.
https://doi.org/10.1109/CVPR.2018.00745

Zhang, X., Iwamoto, Y., Cheng, J., et al. (2021) IDH Mutation Status Prediction by Modality-Self Attention Network. In: Innovation in Medicine and Healthcare, Springer, Singapore, 51-57.
https://doi.org/10.1007/978-981-16-3013-2_5

Huang, G., Zhu, J., Li, J., et al. (2020) Channel-Attention U-Net: Channel Attention Mechanism for Semantic Segmentation of Esophagus and Esophageal Cancer. IEEE Access, 8, 122798-122810.

Yang, X., Luo, Y., Li, M., Yang, Z., Sun, C. and Li, W. (2021) Recognizing Pests in Field-Based Images by Combining Spatial and Channel Attention Mechanism. IEEE Access, 9, 162448-162458.
https://doi.org/10.1109/ACCESS.2021.3132486

Cheng, Y., Yao, L., Xiang, G., Zhang, G., Tang, T. and Zhong, L. (2020) Text Sentiment Orientation Analysis Based on Multi-Channel CNN and Bidirectional GRU with Attention Mechanism. IEEE Access, 8, 134964-134975.
https://doi.org/10.1109/ACCESS.2020.3005823

Tong, W., Chen, W., Han, W., Li, X. and Wang, L. (2020) Chan-nel-Attention-Based DenseNet Network for Remote Sensing Image Scene Classification. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 13, 4121-4132.
https://doi.org/10.1109/JSTARS.2020.3009352

鞠默然, 罗海波, 刘广琦, 等. 采用空间注意力机制的红外弱小目标检测网络[J]. 光学精密工程, 2021, 29(4): 843-853.

郭列, 张团善, 孙威振, 等. 融合空间注意力机制的图像语义描述算法[J]. 激光与光电子学进展, 2021, 58(12): 313-322.

张连超, 乔瑞萍, 党祺玮, 等. 具有全局特征的空间注意力机制[J]. 西安交通大学学报, 2020, 54(11): 129-138.

张丹璐. 结合注意力机制的孪生网络目标跟踪算法研究[D]: [硕士学位论文]. 北京: 北京建筑大学, 2020.

黄勇杰, 高乐, 杨田, 张鑫. 基于多尺度特征和元学习的智能预测找矿靶区实验研究[J]. 计算机应用研究, 2022, 39(6): 1772-1778.
https://doi.org/10.19734/j.issn.1001-3695.2021.10.0625

戴亮亮, 罗敏玄, 张涛, 黄锦彦, 唐尧, 李新, 吴丰, 聂小力. 基于主成分分析法的低山丘陵区土壤厚度快速评定方法与实践——以河南省罗山县为例[J]. 华南地质, 2021, 37(4): 377-386.

郑泽宇, 赵庆英, 李湜先, 等. 地球化学异常识别的两种机器学习算法之比较[J]. 世界地质, 2018, 37(4): 1288-1294.

He, K.M., Zhang, X.Y., Ren, S.Q., et al. (2016) Deep Residual Learning for Image Recognition. Proceedings of In-ternational Conference on Computer Vision and Pattern Recognition, Las Vegas, 27-30 June 2016, 770-778.
https://doi.org/10.1109/CVPR.2016.90

Ma, N.N., Zhang, X.Y., Zheng, H.T., et al. (2018) ShuffleNet V2: Practical Guide-lines for Efficient CNN Architecture Design. Proceedings of European Conference on Computer Vision, Munich, 8-14 September 2018, 122-138.
https://doi.org/10.1007/978-3-030-01264-9_8