用于非局部Allen-Cahn方程的能量耗散型EDNN方法

期刊菜单

用于非局部Allen-Cahn方程的能量耗散型EDNN方法
Energy Dissipative Evolutionary Deep Neural Network Method for the Nonlocal Allen-Cahn Equation

DOI: 10.12677/aam.2025.141008, PDF, HTML, XML,
作者: 祝鸿伟：广东工业大学数学与统计学院，广东广州
关键词: 非局部Allen-Cahn方程；EDNN；能量耗散；标量辅助变量；Nonlocal Allen-Cahn Equation； Evolutionary Deep Neural Networks； Energy Dissipation； Scalar Auxiliary Variable

摘要: 非局部Allen-Cahn的数值模拟在实际应用中得到了广泛应用。然而，开发一种既高效又符合物理定律的数值方法仍是一个重大挑战。近年来，利用神经网络求解偏微分方程显示出了巨大的潜力。受这些研究的启发，我们提出在Evolutionary Deep Neural Network (EDNN)中引入一个辅助变量，以保持偏微分方程的基本物理特性。该方法确保离散数值格式具有无条件能量耗散特性，从而将问题框定为一个最小化任务。我们对非局部Allen-Cahn方程进行了数值模拟，验证了我们修正过的EDNN的准确性和效率。

Abstract: The numerical simulation of nonlocal Allen-Cahn equations has been widely applied in practical applications. However, developing an efficient numerical method that adheres to physical laws remains a significant challenge. Recently, the use of neural networks to solve partial differential equations has demonstrated great potential. Inspired by these studies, we propose incorporating an auxiliary variable into the Evolutionary Deep Neural Network (EDNN) framework to preserve the fundamental physical properties of partial differential equations. This approach ensures that the discrete numerical scheme possesses an unconditionally energy dissipation property, thereby framing the problem as a minimization task. To validate the accuracy and efficiency of our modified EDNN, we conducted numerical simulations of the nonlocal Allen-Cahn equation.

文章引用：祝鸿伟. 用于非局部Allen-Cahn方程的能量耗散型EDNN方法[J]. 应用数学进展, 2025, 14(1): 54-62. https://doi.org/10.12677/aam.2025.141008

1. 引言

过去，研究人员通常采用常规方法对相场模型进行数值模拟。然而，解决这类方程的传统方法需要网格划分、求解非线性方程组、产生大量的计算费用，并面临巨大的技术障碍。目前，随着人工智能的广泛应用，利用神经网络求解偏微分方程得到了研究人员的广泛关注。与传统方法相比，基于神经网络的方法不仅可以实现快速的正演和逆建模[1] [2]，而且可以有效地处理非线性问题[3]。它们可以解决更复杂和高维的偏微分方程，可能会彻底改变传统的数值技术，并促进数值模拟的实质性转变。

近年来，许多学者提出用神经网络求解相场模型。Goswami等人[4]通过最小化系统的变分能量来求解相场方程。Qiu等人[5]通过将相场模型的物理信息编码到神经网络的残差中，开发了基于物理的神经网络相场方法(PF-PINNs)。Kiyani等人[6]提出了基于多层感知器和卷积神经网络(CNN)的数据驱动架构，用于求解相场模型。这些方法大多施加强物理约束，在神经网络训练过程中加入物理约束，以保证相场模型的数值模拟结果满足相应的物理性质。然而，由于相场模型满足某些独特的物理性质，如质量守恒和能量衰减，因此构建无条件满足方程固定物理性质的数值算法是极具挑战性的。

因此，我们的目标是设计一种神经网络方法来求解保证无条件能量耗散的相场模型。在最近的一项研究中，Du等人[7]提出了Evolutionary Deep Neural Network (EDNN)。这种神经网络方法的显著特点在于它的解只表示一个即时解，而神经网络的输出是一个独立时间步长的解。将神经网络参数视为时间t的函数。在初始时间获取参数后，可以使用常规数值方法更新后续的神经网络参数。在EDNN的基础上，我们引入辅助变量来构建一个无条件满足能量耗散特性的神经网络方法。

2. 预备知识

2.1. 非局部Allen-Cahn方程的性质

从数学的角度来看，相场模型总是由自由能的泛函变化推导出来的。经典的Allen-Cahn方程是Allen和Cahn (1979) [8]提出的，用于模拟结晶固体中反相边界的运动。经典的Allen-Cahn方程

$\frac{\partial u}{\partial t} = ε^{2} Δ u + f (u)$ (1)

在L2梯度流的自由能泛函可表达为

$E (u) = \int_{Ω} (\frac{ε^{2}}{2} | \nabla u (x) | + F (u (x))) d x$ .

简单来说把非局部算子 $- ℒ$ 替换掉(1)中的拉普拉斯算子 $Δ$ 可以得到非局部Allen-Cahn方程

, (2)

其中 $F^{'} (u) = - f (u)$ ，非局部算子 $- ℒ$ 的定义为

$ℒ u (x) = \int_{Ω} K (x - y) [u (x) - u (y)] d y$ ,

核函数K通常满足对称性、正定性、归一性等性质。

非局部自由能泛函表示为

$E (u) = \int_{Ω} (\frac{ε^{2}}{4} \int_{Ω} J (x - y) {[u (x) - u (y)]}^{2} d y + F (u (x))) d x$ . (3)

根据非局部算子L的定义及核函数K所满足的条件，我们可以推导出

$(ℒ u, u) = \frac{1}{2} \int_{Ω} \int_{Ω} K (x - y) {[u (x) - u (y)]}^{2} d y d x \geq 0$

因此，非局部自由能泛函(3)可以等效表示为

$E (u) = \frac{ε^{2}}{2} (ℒ u, u) + \int_{Ω} F (u (x)) d x$ . (4)

由[9]可知，非局部Allen-Cahn方程满足能量耗散规律，即非局部Allen-Cahn方程精确解会对应的自由能泛函会随着时间减小。

2.2. Evolutionary Deep Neural Network

初始时，训练EDNN的参数用于表示系统的初始状态，随后无需进一步训练即可动态更新，以准确预测偏微分方程系统的演化过程。边界条件作为硬约束嵌入到神经网络中，确保整个求解轨迹完全符合物理规律。EDNN以x作为输入，网络参数向量 $W (t)$ 包含了所有神经网络的参数。EDNN的输出表示为

$u (x, W (t)) = σ_{n} (\dots σ_{2} (σ_{1} (W_{1} x + b_{1}) + b_{2}) \dots + b_{n})$ ,

其中 $W_{i}$ 表示第i层的权重矩阵， $b_{i}$ 表示第i层的偏置向量， $σ_{i}$ 表示第i层的激活函数，n表示网络的总层数。EDNN的核心目标是在初始时刻利用给定的初始值对神经网络参数进行训练。基于链式法则，可以推导出以下关系

$\frac{\partial u}{\partial t} = \frac{\partial u}{\partial W} \frac{\partial W}{\partial t}$ .

我们的目标就是要推导出 $\frac{\partial W}{\partial t}$ ，在EDNN中，我们可以通过以下公式得到

$\frac{\partial W}{\partial t} = argmin J (γ), where J (γ) = \frac{1}{2} \int_{Ω} {| \frac{\partial u}{\partial W} γ - (- ε^{2} ℒ u + f (u)) |}^{2} d x$ . (5)

完成神经网络训练并获得初始网络参数 $W (0)$ 后，可以采用常规数值方法(例如欧拉法)来更新后续参数，具体表达如下：

$\frac{W^{n + 1} - W^{n}}{τ} = argmin J (γ)$ .

$W^{n} = W (t_{n})$ ，其中 ${t_{n}}$ 表示[0, T]的分区， $τ$ 表示时间步长。

EDNN在求解热方程、Burgers方程[7]等方面展现了较强的通用性和准确性。然而，在求解非局部Allen-Cahn方程时，它未能保持能量耗散特性。为了解决这一问题，我们在EDNN中引入了辅助变量，从而构建了一种能够保持能量耗散、精确易于实现的数值格式。

3. 能量耗散型EDNN

最近，[10]基于stabilized exponential scalar auxiliary variable (sESAV)构造了非局部Allen-Cahn方程的一阶无条件能量稳定格式。更准确地说，它进入了辅助变量 $s (t) = E_{1} (u (t))$ ，将(2)改写为

, (6)

其中 $f (u) = - F^{'} (u)$ ， $E_{1} (u) = \int_{Ω} F (u (x)) d x$ 。同时构造了一个修正后的非局部自由能泛函

$\bar{E} (u, s) = \frac{ε^{2}}{2} (ℒ u, u) + s$ , (7)

使其在连续意义上等价于初始能量泛函(4)且在[10]中证明了格式(6)满足能量耗散规律。

为确保修正后的能量耗散规律在EDNN中得以保持，我们只需用 $\frac{\exp {s}}{\exp {E_{1} (u)}} f (u)$ 替换(5)中的 $f (u)$ 此时，神经网络的更新规则为

$\frac{\partial W}{\partial t} = argmin J (γ), where J (γ) = \frac{1}{2} \int_{Ω} {| \frac{\partial u}{\partial W} γ - (- ε^{2} ℒ u + \frac{\exp {s}}{\exp {E_{1} (u)}} f (u)) |}^{2} d x$ .

从最优性准则推导出的线性系统为

$\nabla_{γ} J (γ_{opt}) = (\int_{Ω} \frac{\partial u^{n}^{T}}{\partial W} \frac{\partial u^{n}}{\partial W} dx) γ_{opt} - (\int_{Ω} \frac{\partial u^{n}}{\partial W} (ε^{2} Δ u^{n} + \frac{\exp {s}}{\exp {E_{1} (u^{n})}} f (u^{n})) d x) = 0$ ,

最优解 $γ_{opt}$ 的近似值 ${\hat{γ}}_{opt}$ 是通过求解 $J^{T} J {\hat{γ}}_{o p t} = J^{T} N$ 得到的。 $J$ 是神经网络的梯度， $N$ 表示在特定空间点处计算的偏微分方程算子。它们定义为

${(J)}_{i j} = \frac{\partial u^{i}}{\partial W_{j}}, {(N)}_{i} = ε^{2} Δ u^{i} + \frac{\exp {s}}{\exp {E_{1} (u^{i})}} f (u^{i})$ ,

其中，索引 $i = 1, 2, \dots$ 对应于配点，而索引 $j = 1, 2, \dots$ 表示神经网络参数。方程 $J^{T} J {\hat{γ}}_{o p t} = J^{T} N$ 的解可作为 $W$ 时间导数的近似值。求解方程 $J^{T} J {\hat{γ}}_{o p t} = J^{T} N$ 的两种方法包括直接求逆和优化。当 ${\hat{γ}}_{opt}$ 被求得后，使用正向欧拉法计算 $W^{n + 1}$ 。

4. 数值实验

本节旨在通过数值实验，测试和比较所提出的能量耗散型EDNN和EDNN，特别关注数值能量稳定性。我们考虑在二维空间域 $Ω = (- 1, 1) \times (- 1, 1)$ 上，具有高斯核函数和周期边界条件非局部Allen-Cahn方程。我们定义高斯核为

$K_{δ} = \frac{4}{π^{\frac{d}{2}} δ^{d + 2}} e^{- \frac{{| x |}^{2}}{δ^{2}}}$ ，其中 $δ = 0.05, d = 2$ 。

此时，非局部Allen-Cahn方程可以用下面的方程来描述

通常， $ε$ 设为0.01， $f (u) = - F^{'} (u) = u - u^{3}$ 。在整个训练阶段，选择 $τ = 0.001$ ，网格由65 × 65个空间点组成。利用能量耗散型EDNN和EDNN方法计算不同时刻的数值解，如图1所示。为了确定数值误差，

(a) T = 0.25 (b) T = 0.5

(e) T = 0.25 (f) T = 0.5

(g) T = 0.75 (h) T = 1

(i) T = 0.25 (j) T = 0.5

(k) T = 0.75 (l) T = 1

Figure 1. (a)~(d) is the solution obtained by the EDNN; (e)~(h) is the solution obtained by the energy dissipation EDNN; (i)~(l) represents the benchmark solution

图1. (a)~(d) 是通过EDNN获得的解；(e)~(h) 是通过能量耗散型EDNN获得的解；(i)~(l)表示基准解

采用传统的sESAV方法计算的解作为基准，两种方法得到的解的误差比较详见表1和图2。表1汇总了两种方法在均方误差(MSE)指标上的对比结果，可以看出，与基准解相比，能量耗散型EDNN在相同时间步长和空间网格下的均方误差均显著低于EDNN方法的误差，展现了其更高的精确性。图2进一步展示了两种方法的绝对误差，从图中可以清晰地观察到，能量耗散型EDNN的误差更小。结合表1和图2的结果可知，

Table 1. Error comparison for different methods

表1. 不同方法的误差比较

误差	T = 0.25	T = 0.5	T = 0.75	T = 1
EDNN	3.88e−02	1.75e−01	3.73e−01	7.06e−02
能量耗散型EDNN	5.04e−05	2.68e−04	7.72e−04	1.64e−03

(a) T = 0.25 (b) T = 0.5

(e) T = 0.75 (f) T = 0.75

(g) T = 0.75 (h) T = 0.75

Figure 2. (a)~(d) are the errors between the EDNN and the benchmark; (e)~(h) are the errors between the energy dissipation EDNN and the benchmark

图2. (a)~(d) 表示EDNN与基准之间的误差；(e)~(h) 表示能量耗散型EDNN与基准之间的误差

能量耗散型EDNN在数值精度上优于传统EDNN方法，且在与sESAV基准解的对比中表现出明显的优势。随后，对能量耗散型EDNN和EDNN进行能量计算，并与基准能量值进行比较，如图3所示。结果表明，EDNN计算的数值解不符合能量耗散规律，而能量耗散型EDNN计算的数值解能够准确满足能量耗散规律，这一特点验证了能量耗散型EDNN方法在保持解的物理一致性方面的优越性。

Figure 3. The energy of simulated solutions computed by the EDNN and energy dissipation EDNN methods

图3. 采用EDNN和能量耗散型EDNN方法计算模拟解的能量

5. 结论

在本研究中，我们在EDNN框架中引入辅助变量来解决周期边界条件下的非局部Allen-Cahn方程的能量耗散问题。通过引入合适的辅助变量，使得EDNN的输出满足能量耗散，进一步提高了解的精度。

致谢

作者在此向所有给予我支持与帮助的人表达由衷的感谢。

参考文献

[1]	Wang, N., Chang, H. and Zhang, D. (2021) Deep‐Learning‐Based Inverse Modeling Approaches: A Subsurface Flow Example. Journal of Geophysical Research: Solid Earth, 126, JB020549. https://doi.org/10.1029/2020jb020549
[2]	Xu, H., Chang, H. and Zhang, D. (2021) DL-PDE: Deep-Learning Based Data-Driven Discovery of Partial Differential Equations from Discrete and Noisy Data. Communications in Computational Physics, 29, 698-728. https://doi.org/10.4208/cicp.oa-2020-0142
[3]	Raissi, M., Perdikaris, P. and Karniadakis, G.E. (2017) Physics Informed Deep Learning (Part I): Data-Driven Solutions of Nonlinear Partial Differential Equations. arXiv: 1711.10561.
[4]	Goswami, S., Anitescu, C., Chakraborty, S. and Rabczuk, T. (2020) Transfer Learning Enhanced Physics Informed Neural Network for Phase-Field Modeling of Fracture. Theoretical and Applied Fracture Mechanics, 106, Article 102447. https://doi.org/10.1016/j.tafmec.2019.102447
[5]	Qiu, R., Huang, R., Xiao, Y., Wang, J., Zhang, Z., Yue, J., et al. (2022) Physics-Informed Neural Networks for Phase-Field Method in Two-Phase Flow. Physics of Fluids, 34, Article 052109. https://doi.org/10.1063/5.0091063
[6]	Kiyani, E., Silber, S., Kooshkbaghi, M. and Karttunen, M. (2022) Machine-Learning-Based Data-Driven Discovery of Nonlinear Phase-Field Dynamics. Physical Review E, 106, Article 065303. https://doi.org/10.1103/physreve.106.065303
[7]	Du, Y. and Zaki, T.A. (2021) Evolutional Deep Neural Network. Physical Review E, 104, Article 045303. https://doi.org/10.1103/physreve.104.045303
[8]	Allen, S.M. and Cahn, J.W. (1979) A Microscopic Theory for Antiphase Boundary Motion and Its Application to Antiphase Domain Coarsening. Acta Metallurgica, 27, 1085-1095. https://doi.org/10.1016/0001-6160(79)90196-2
[9]	Cheng, Q., Liu, C. and Shen, J. (2021) Generalized SAV Approaches for Gradient Systems. Journal of Computational and Applied Mathematics, 394, Article 113532. https://doi.org/10.1016/j.cam.2021.113532
[10]	Meng, X., Cheng, A. and Liu, Z. (2023) The Stabilized Exponential-SAV Approach Preserving Maximum Bound Principle for Nonlocal Allen-Cahn Equation. arXiv:2307.13934.

为你推荐

友情链接