1. 引言
在全球迫切应对气候变化的大背景下,中国积极采取行动,通过建立碳排放权交易市场,来促进降碳减排,并成为有效减缓碳排放的重要举措。早在2011年“十二五”规划中,中国政府正式提出在全国范围逐步构建全国碳排放权交易市场的计划。于2011年10月,北京、上海、重庆、广东、湖北、天津、深圳七省市率先在碳排放交易方面进行了试点工作。自2013年起,这七个省市陆续上线了碳交易市场。福建碳市场则于2016年底正式启动交易。2017年底,《全国碳排放权交易市场建设方案》正式印发,要求全面建设全国碳市场。2021年,全国碳市场以电力行业为切入点正式启动运行。碳交易作为重要的政策工具,通过市场机制实现碳总量与碳强度的同时调控,促进降碳减排,推动低碳可持续发展。然而,当前碳市场的收益率呈现出显著的动态非线性和混沌性特征,使得预测其市场收益率成为一项复杂且具有挑战性的任务。
本研究将通过构建自适应模糊–神经网络(ANFIS)模型,深入分析碳市场交易特征及经济政策不确定性对市场收益率的影响。ANFIS (自适应模糊–神经网络系统)是一种集成模糊逻辑系统和神经网络的混合智能方法。其主要功能是利用神经网络的学习能力优化模糊逻辑系统的规则和隶属度函数。ANFIS的优势在于它能够处理复杂的非线性关系和不确定性,这使得它在碳市场收益率预测中尤为有效。通过将模糊逻辑的解释能力与神经网络的学习能力结合,ANFIS能够捕捉碳市场的动态非线性特征,并提供高精度的预测结果。
作为全球碳排放削减的策略工具,碳市场旨在通过其调控功能来推动减排措施的高效执行,因此,碳市场与金融市场具有相似的金融属性[1]。由于碳市场运行机制的复杂性,使得影响碳排放权收益的因素众多。从市场的微观结构角度出发,市场流动性是刻画市场效率的关键指标。研究表明,市场流动性不足会影响股票的事前超额回报[2]。碳试点市场效率低下的主要原因之一是由于缺乏市场平衡机制而引起的市场流动性差[3]。增强碳配额的流动性,在一定程度上有助于提高企业参与的积极性,从而提高市场效率[4]。在碳排放交易市场中,日度流动性对第二天的横截面收益具有显著的预测效果[5]。市场交易量是市场活跃度的体现,是对市场中新信息的反映,被用来作为信息强度的表示变量[6]。在碳试点市场中,交易量不仅有利于市场流动性,也有利于碳价的稳定[7]。中国的排放交易试点(CETS)中存在着不同的排放交易试点,涉及配额分配方法、行业覆盖范围、覆盖实体和市场规则等多方面的差异。这些差异可能导致交易碎片化程度不同。值得注意的是,更大的交易碎片化可能会对单个市场乃至整体市场的流动性产生负面影响,这会影响市场的质量[8] [9]。Lanzi等[10]发现,碳排放的配额制呈现出碎片化的特点,各个地区的排放配额价格存在显著的差异。碳交易市场的碳排放权市场碎片化(后简称市场碎片化,EMF)是指当前区域排污权交易试点的成交额占中国八个区域排污权交易试点的总成交额的比值。通过定义市场碎片化,探讨了市场碎片化和流动性对中国八个排污权交易试点价格的影响,得到市场碎片化对北京、广东和湖北碳排放权交易体系试点的排放配额回报有显著影响,本文对碳市场碎片化的测度也将采用此方法[11] [12]。由于各试点市场在政策环境、经济结构以及市场成熟度等方面的差异,经济政策的不确定性对这些市场的收益率影响程度和方向可能会有所不同。
基于以上的分析,本文可能的边际贡献在以下三个方面:第一,在碳试点市场指标构建上,本研究采用ANFIS模型,通过市场流动性、交易量、市场碎片化以及经济政策不确定性这四个关键变量来预测中国碳试点市场收益率,并进一步分析相关变量间的联系,这为之前的研究提供了新的视角。第二,在方法上,我们首次使用ANFIS模型来预测中国碳试点市场的收益率,研究结果显示,ANFIS模型显著提高了中国碳试点市场收益率的样本外预测精度,并能有效地捕获碳市场的非线性特征。第三,在异质性分析上,从所建模型的各个因素对碳市场收益率进行讨论,中国碳试点市场由于其自身的试点运行机制的不同,市场的交易特征尤其是市场碎片化和经济政策不确定性对各试点的影响具有显著的异质性特征。
2. 理论分析与假设提出
2.1. 碳市场的非线性动态行为可通过自适应模糊–神经网络(ANFIS)模型有效捕捉
众多学者以不同方式尝试提高预测准确性,以期更有效地促进碳市场的运行和管理。然而,我国碳交易市场的交易价格明显存在动态非线性、非平稳性、高噪声等特点[13]。大量的计量、统计模型被用来建立碳市场碳排放权收益率预测模型,如自回归移动平均模型(ARIMA) [14]、广义自回归条件异方差模型(GARCH) [15]、已实现波动率模型(HAR-RV) [16]等,能够简单、有效地捕捉到市场中的微观、宏观因素对收益率的影响,但遗憾的是,这些模型对数据分布要求较高,且仅能有效地捕捉线性(或平方线性)关系。随着人工智能技术的飞速发展和广泛应用,大量的学者开始基于数据原始特征采用机器学习的方法,如人工神经网络(ANN) [17]、支持向量机(SVM) [18]、随机森林[19]、LASSO回归[20]等来建立预测模型,能够较好地 捕获到金融市场的非线性关系能力。
在金融市场建模中,模糊逻辑被广泛应用以更有效地捕捉和减少数据的不确定性的影响。通过模糊逻辑过程,研究者能够发现变量与其结果之间存在的规则或联系,这有助于深入理解金融市场中起关键作用的元素,从而提升建模的准确性。传统的模糊系统依赖于人类专家的经验知识和推理过程,提出IF-THEN规则集以建立模糊模型,并设计模糊控制系统。然而,这种方法不能自动将人类专家的知识经验转化为推理规则库,也缺乏有效的方法来改进隶属函数以减少输出误差或提高性能指标。为弥补这一不足,Jang [21]将模糊逻辑嵌入到人工神经网络(ANN)中,提出了自适应神经模糊推理系统(ANFIS)。每个模糊系统都通过应用两种方法来实现,即Mamdani模型和Takagi-Sugeno-Kang模型,其混合算法采用反向传播算法和最小二乘法,用于调整模糊推理系统(FIS)的参数和输出,并能自动生成IF-THEN规则。随后,自适应神经模糊推理系统得到了广泛的应用,并与量子行为粒子群优化与自适应模糊神经网络(ANFIS-QPSO)的混合方法在预测外汇市场价格方面表现非常准确和高效[22]。Khan等[23]利用ANFIS模型预测全球能源行业二氧化碳排放量,与传统统计方法的比较,该方法的预测效果更佳,均方根误差(RMSE)更低。Tian等[24]提出一种新的混合优化算法HOA与ANFIS模型结合,对欧盟碳排放交易体系和中国深圳碳价格数据进行点预测和区间预测。据此,本文提出假说H1:
H1:碳市场的非线性动态行为可通过自适应模糊–神经网络(ANFIS)模型有效捕捉。
2.2. 经济政策不确定性对中国碳市场收益率的影响
碳市场是各国政府用市场化的手段来调控碳排放的政策工具,碳市场的产生、运行都高度依赖于政府的经济政策,这就使得碳市场对经济政策不确定性的敏感度很高[25]。当碳市场政策因素属于宽松政策,对企业的配额充足,碳市场供给充足,将导致碳价下降且碳市场价格收益率降低;当碳市场政策因素属于紧缩政策,对企业的配额紧缩,碳市场供给不足,将导致碳价上升且碳市场价格收益率增加[26]。在COVID-19大流行期间,通过影响EPU来影响碳期货收益,证实了经济政策不确定性(EPU)对碳期货价格收益产生负面影响[27]。据此,本文提出假说H2:
H2:经济政策不确定性对中国碳市场收益率的影响具有显著的异质性特征。
3. 研究设计
3.1. 自适应模糊神经网络(ANFIS)
人工神经网络(ANN)是一种模拟生物神经系统基本构造和功能的计算模型,通过多层神经元的连接和权重调节,以非线性的方式进行信息处理和模式识别的人工智能技术。自适应神经网络是由节点和定向链路组成的网络结构,整体的输入输出行为由节点连接的可修改参数集合的值决定。Jang [21]基于金融市场中宏观、微观数据的不确定性和复杂性,将模糊逻辑嵌入到人工神经网络(ANN)中,采用自然语言定义各变量的模糊程度。模糊推理是利用模糊集理论将给定的输入映射到输出数据集的过程,这种输入–输出的映射关系由一组具有适当隶属函数的模糊规则组成。这里,我们假设所考虑的模糊推理系统有两个输入x和y以及一个输出函数f,并假设规则库包含Takagi-Sugeno类型的if-then规则。
和
是模糊集合,用于模糊逻辑推理。f表示一个确定的函数,用于形成输出,可以是不同阶数(常数、线性等)的多项式函数,f的参数(
、
和
)在训练过程中进行估计。
(1)
图1展示了创建预测模型过程中使用的五个关键层。以下是ANFIS (自适应神经–模糊推理系统)结构的不同层次以及每个层次相关的计算和概念。
Layer 1:该层中的每个节点i都是一个具有节点函数的正方形节点:
(2)
其中,x为节点i的输入,
是该节点函数相关的语言标签(低、中、高等)。也就是说,
是
的隶属
度函数,它规定了给定的x满足量词
的程度,
。通常,我们根据数据特点构造隶属函数
的最大值为1,最小值为0的钟形函数,如
(3)
或
(4)
式中:
为参数集。随着这些参数的取值变化,钟形函数也随之变化,从而在语言标签
上表现
出多种形式的隶属函数。事实上,任何连续且分段可微的函数,如常用的梯形或三角形隶属函数,也是该层节点隶属函数的合格候选者。该层中的参数称为前提参数。
Layer 2:该层中的每个节点都是一个标记为
的圆环节点,它将输入的信号进行乘法运算,并将乘积输出。例如:
(5)
每个节点的输出代表一条规则的触发强度。
Layer 3:在这个层次中,每一个节点都是一个N标识的圆圈节点,第
个节点负责计算第
条规则的触发强度与所有规则触发强度总和的比例:
Figure 1. ANFIS model
图1. ANFIS模型
(6)
这层的输出被称为归一化触发强度。
Layer 4:该层中的每个节点k都是一个具有节点函数的正方形节点:
(7)
式中:
为第3层的输出,
为参数集。该层中的参数将称为后件参数。
Layer 5:该层中的单个节点是一个标记为Σ的圆节点,它将总的输出计算为所有输入信号的总和,即:
(8)
本文的主要目的是根据

2014年1月1日至2022年6月17日期间中国六大碳试点的Amihud非流动性、市场碎片化、交易量和经济政策不确定性指标来预测碳市场收益率。在构建估算模型时,通过真实数据库应用了ANFIS的模糊规则,从而能够很好地捕捉到碳市场的不确定的信息。为了预测碳市场收益率(Y),选择了四个关键指标,即Amihud非流动性(
)、市场碎片化(
)、交易量(
)和经济政策不确定性(
)作为输入。进一步利用模糊规则生成输入和输出指标之间的联系(
),以准确预测碳市场收益率。构建ANFIS模型时,我们将80%的数据用于训练,20%的数据用于测试ANFIS模型。本研究中使用的最终ANFIS架构如图2所示。
Figure 2. ANFIS architecture
图2. ANFIS结构
3.2. 变量测度
碳市场收益率
:
(9)
其中,
代表i试点市场第t日的收益率,
代表i试点市场第t日的成交均价,
则为i试点市场第
日(上一个有成交量的交易日)的成交均价。各个碳试点市场的交易详情、活跃度有差异,部分碳市场存在交易日数据缺失的现象,我们研究各试点市场有交易量的交易日。对于预测各试点市场收益率的另外两个变量是
、
,其中,
代表i试点市场第t日的成交量,
代表第t日中国经济政策不确定性指数[28]。
我们对碳市场碎片化的度量使用以下公式计算[11]:
(10)
式中,
代表i试点市场第t日的市场碎片化,变量
代表i试点市场t日的成交额,
代表八个碳试点市场在第t日的总成交额。较低的市场碎片化表示在当前碳试点市场交易中更分散。
高流动性的试点市场通常表现为连续的交易流动和小幅价格波动。相比之下,流动性较低的试点市场可能出现大量的非交易时段和较低的收益率。在不同的区域排放交易试点中,涉及的行业、配额分配方法、交易市场规则和市场结构往往在排放配额交易活动上展现出显著的差异,这导致了区域排放交易试点中配额的碎片化分布,并对碳试点的流动性和价格效率产生不同的影响。对于排放交易市场非流动性,我们参考了Amihud [2]提出的每日市场非流动性指标。
(11)
式中,
代表i试点市场第t日的市场非流动性,变量
代表i试点市场第t日的市场收益率,
代表i试点市场第t日的每百元的成交额。流动性比率捕捉与交易价值或订单流的价格波动或价格影响相关的情况,刻画了碳市场的价格冲击。Amihud非流动性指标
值越大,表明碳试点市场i在交易日t的流动性越差。
3.3. 数据处理与初步分析
自2013年以来,中国陆续建立了深圳、北京、上海、广东、湖北、天津、重庆及福建八个碳试点市场和全国碳市场,其中,重庆试点和福建试点从2017年开始交易,启动时间晚。考虑交易启动时间和交易规模,本文选取广东、上海、深圳、湖北、北京、天津六个碳试点市场为研究对象,剔除各个碳试点市场的交易量为0的交易日,研究时间段为2014年1月1日到2022年6月17日,各个碳试点市场有成交量的交易天数分别为:深圳1843天、北京1167天、上海1257天、广东1711天、湖北1865天、天津765天。各个试点的交易信息数据来源为WIND数据库1,中国经济政策不确定性指数来源为中国经济政策不确定性网站2。
Table 1. Descriptive statistics
表1. 描述性统计
Variables |
Mean |
Std. Dev |
Skewness |
Kurtosis |
JB-stat |
ADF |
Beijing |
|
|
|
|
|
|
Return |
0.0002 |
0.0365 |
−0.376 |
5.459 |
343.622*** |
−12.491*** |
Illiquidity |
0.0026 |
0.0004 |
8.580 |
76.875 |
323427*** |
−9.441*** |
EMF |
0.178 |
0.2250 |
1.654 |
5.121 |
801.965*** |
−5.843*** |
Volume |
13445.179 |
24764.296 |
3.095 |
13.966 |
8238.244*** |
−6.482*** |
EPU |
132.561 |
58.285 |
1.478 |
7.255 |
343.622*** |
−7.884*** |
续表
Shanghai |
|
|
|
|
|
|
Return |
0.0003 |
0.032 |
1.389 |
50.804 |
119998.4*** |
−10.390*** |
Illiquidity |
0.011 |
0.006 |
15.771 |
313.104 |
5199172*** |
−9.916*** |
EMF |
0.1334 |
0.189 |
1.984 |
6.8763 |
1610.561*** |
−7.088*** |
Volume |
14359.545 |
36993.688 |
6.603 |
63.948 |
203525.2*** |
−7.141*** |
EPU |
132.677 |
59.765 |
1.5248 |
7.702 |
1643.848*** |
−8.003*** |
Tianjin |
|
|
|
|
|
|
Return |
0.0001 |
0.0310 |
0.064 |
42.375 |
57707.07*** |
−9.791*** |
Illiquidity |
0.0002 |
0.0002 |
10.593 |
129.627 |
554277.3*** |
−6.280*** |
EMF |
0.099 |
0.189 |
2.388 |
5.06 |
1556.921*** |
−4.752*** |
Volume |
24381.735 |
80946.241 |
5.683 |
38.639 |
52127.9*** |
−5.559*** |
EPU |
137.362 |
57.577 |
1.583 |
4.946 |
1109.82*** |
−5.8792*** |
Guangdong |
|
|
|
|
|
|
Return |
0.0001 |
0.0812 |
−0.406 |
35.374 |
92405.44*** |
−16.743*** |
Illiquidity |
0.004 |
0.003 |
31.477 |
1140.435 |
96265925*** |
−11.376*** |
EMF |
0.338 |
0.346 |
0.6266 |
−1.133 |
209.996*** |
−6.434*** |
Volume |
104617.29 |
229134.11 |
5.373 |
50.276 |
195064.6*** |
−7.670*** |
EPU |
132.399 |
63.067 |
1.534 |
4.380 |
2111.338*** |
−7.6991*** |
Shenzhen |
|
|
|
|
|
|
Return |
−0.0001 |
0.1390 |
0.3585 |
23.7709 |
33133.66*** |
−15.074*** |
Illiquidity |
0.150 |
8.153 |
40.6824 |
1706.794 |
224458139*** |
−11.109*** |
EMF |
0.199 |
0.279 |
1.432 |
3.859 |
685.983*** |
−6.177*** |
Volume |
27768.208 |
135201.692 |
24.286 |
677.422 |
35071397*** |
−10.051*** |
EPU |
131.707 |
62.336 |
1.940 |
12.177 |
7615.742*** |
−8.196*** |
Hubei |
|
|
|
|
|
|
Return |
0.0002 |
0.0171 |
0.064 |
9.406 |
3285.782*** |
−13.742*** |
Illiquidity |
0.0008 |
0.0001 |
15.990 |
275.269 |
6159771*** |
−11.426*** |
EMF |
0.289 |
0.302 |
0.938 |
2.616 |
226726.1*** |
−6.900*** |
Volume |
41304.769 |
75599.112 |
5.521 |
55.064 |
251887.3*** |
−8.152*** |
EPU |
132.079 |
62.060 |
1.523 |
7.391 |
2285.54*** |
−7.750*** |
注:Return是指碳市场收益率,我们使用了几个统计量,包括样本均值(Mean)、标准差(Std. Dev)、偏度、峰度、Jarque-Bera统计量(JB-stat)和增广Dickey-Fuller检验(ADF)。***、**和*分别表示在1%、5%和10%的水平上拒绝原假设。
根据表1,以各碳试点市场的收益率为例,平均值非常小,从深圳试点的−0.0001到上海试点的0.0003。此外,标准差介于0.0171和0.1390之间。峰度结果明显大于正态分布,说明各试点的收益率呈厚尾分布。此外,北京和广东试点的偏度结果为负,表明这两个收益率序列均为尖峰。Jarque-Bera检验结果在1%的显著性水平下拒绝了正态分布误差的原假设,表明所有的收益率时间序列都不是正态分布的。这些结果表明,这些收益序列存在显著的自相关性、条件异方差性和波动聚集性。从Dickey-Fuller (ADF)单位根检验结果得出每个收益率时间序列在1%的显著性水平下是平稳的。Amihud非流动性指标反映的是碳市场的不流动性程度,排放配额的交易价格波动越大,碳市场流动性越差。从均值mean来看,湖北和天津试点保持最高的市场流动性,北京、上海和广东试点表现出较高的市场流动性,深圳试点的市场流动性最低。
以湖北为例的变量间部分效应图见图3,若图中展示的是一条直线,则可以暗示着该自变量与因变量之间存在线性关系。这意味着,自变量的变化与因变量的变化之间存在恒定的比例关系。相反,如果部分效应图中展示的是曲线,特别是非线性曲线,那么可以暗示着自变量与因变量之间存在非线性关系。可以看出,Amihud非流动性和经济政策不确定性EPU分别与因变量收益率之间存在明显的非线性关系,交易量Volume和市场碎片化EMF分别与因变量收益率存在线性关系。
Figure 3. Partial effect map
图3. 部分效应图
4. 中国碳市场收益率的实证分析
4.1. ANFIS模糊化过程
在训练ANIFIS模型时,我们使用反向传播算法和最小二乘法。首先,对于各个碳试点市场的数据集,为了提高模型性能的准确性和速度,我们将数据归一化为0~1范围。
(12)
其中,
是归一化值,x是变量值,
是此变量的最小值,
是此变量的最大值。其次,我们将各个碳试点市场80%的数据用于样本内预测,20%的数据用于样本外预测。为了方便起见,这里仅展示ANFIS生成的天津碳市场数据中基于梯形隶属函数(MFs)的类型,见表2。可以发现,在输入模糊化步骤中,有三种不同的语言因素作为输入,分别是“低”、“中”和“高”。表中显示了基于“Illiquidity (X1)”、“EMF (X2)”、“Volume (X3)”、“EPU (X4)”的ANFIS模型生成的高斯隶属度。对于“低”、“中”和“高”,X1的计算结果为[−0.2944 −0.1262 0.1266 0.2997]、[0.137 0.296 0.548 0.717]和[0.5468 0.715 0.9674 1.136];X2的计算结果分别为[−0.35 −0.15 0.1496 0.3442]、[0.1468 0.3496 0.6498 0.8505]和[0.6492 0.8498 1.15 1.35];X3的计算结果分别为[−0.35 −0.15 0.1674 0.3746]、[0.1658 0.3676 0.6495 0.85]和[0.645 0.8495 1.15 1.35];X4的计算结果分别为[−0.35 −0.15 0.145 0.3542]、[0.1476 0.3452 0.65 0.85]和[0.6499 0.85 1.15 1.35]。
Table 2. Range of affiliation functions generated by ANFIS based on Tianjin data
表2. 根据天津数据由ANFIS生成的隶属函数范围
Indicators |
|
Type of membership function |
The varieties of MFs for “Low”, “Moderate” and “High” |
Low |
Moderate |
High |
Inputs |
Illiquidity |
Trapmf MFs |
[−0.2944 −0.1262 0.1266 0.2997] |
[0.1354 0.2949 0.5468 0.715] |
[0.5468 0.715 0.9674 1.136] |
EMF |
Trapmf MFs |
[−0.35 −0.15 0.1496 0.3442] |
[0.1468 0.3496 0.6498 0.8505] |
[0.6492 0.8498 1.15 1.35] |
Volume |
Trapmf MFs |
[−0.35 −0.15 0.1674 0.3746] |
[0.1658 0.3676 0.6495 0.85] |
[0.645 0.8495 1.15 1.35] |
EPU |
Trapmf MFs |
[−0.35 −0.15 0.145 0.3542] |
[0.1476 0.3452 0.65 0.85] |
[0.6499 0.85 1.15 1.35] |
为了显示ANFIS在各个碳试点市场得出的结果,输入参数和输出之间的相互依存关系通过曲面图直观地表现出来。根据图4,是由天津碳市场数据的每个变量根据ANFIS生成的隶属度函数。根据真实数据集的输入和输出数值,使用模糊规则绘制曲面图,图5显示了不同的两个变量对天津碳市场收益率的影响,其中,不同的颜色显示了基于输入指标、模糊规则和输出指标的模糊推理系统(FIS)行为。
Figure 4. ANFIS affiliation functions generated from Tianjin carbon pilot market data
图4. 由天津碳试点市场数据生成的ANFIS隶属函数
Figure 5. Inter-variant-based forecasting of carbon market returns
图5. 基于变量间的碳市场回报预测
为了展示碳市场收益率的变化以及非流动性、市场碎片化、交易量和经济政策不确定性这四个输入指标的变化,我们构建了一个模糊规则显示器来展示模糊推理过程的路线图。根据图5中提供的模糊规则显示器,可以观察到模糊输入指标的变化,并对输出指标(即碳市场收益率)进行去模糊化处理,从而得到相应的变化结果。
4.2. 模型评价指标
在计量经济学领域,稳定的回归结果通常可以提高样本内估计的准确性。然而,金融危机等特殊情况可能会破坏回归结果的稳定性,因此在样本外的预测表现也需要进行评估。对于日频率数据而言,许多经济预测指标的不稳定性问题也不可避免。这意味着,尽管可能存在样本内可预测性,但在进行递归样本外(OS)估计时,它们的可预测性通常会大幅下降。因此,样本内可预测性并不一定意味着样本外可
预测性。为了评估各个预测模型在样本外的表现,我们考虑了几个常用的度量标准,包括样本外
、均方根误差(RMSE)和平均绝对误差(MAE)。这些度量标准可以通过以下公式:
(13)
(14)
(15)
其中,
是碳市场收益率实际值,
是碳市场收益率预测值,
是第1天到第t天的碳市场收益率的平均值。
为正数则说明预测回归的预测效果优于基准方法中的历史平均预测。因此,
表示存在可预测性。Welch等[29]的研究表明,预测因子要战胜历史平均基准并非易事。RMSE、MAE则分别表示模型的均方根误差和平均绝对误差,数值介于0和1之间,值越小表示模型的预测性能越好。ANFIS与线性回归(Linear)、Lasso回归、反向传播神经网络(BPNN)、随机森林(RandomForest)、支持向量机(SVM)对比,得到的样本外预测精度结果如表3所示,可以看到ANFIS模型拥有最佳的样本外预测效果,从而验证假说H1成立。
Table 3.
, RMSE, and MAE results for predictive models
表3. 预测模型的
、RMSE和MAE结果
Pilots |
Model |
Performance Criteria |
|
RMSE |
MAE |
Beijing |
ANFIS |
0.9334 |
0.1085 |
0.0669 |
Linear |
0.9250 |
0.1146 |
0.0704 |
Lasso |
0.9260 |
0.1139 |
0.0700 |
BPNN |
0.9113 |
0.1247 |
0.0743 |
RandomForest |
0.9260 |
0.1129 |
0.0678 |
SVM |
0.9235 |
0.1158 |
0.0701 |
续表
Shanghai |
ANFIS |
0.9709 |
0.0321 |
0.0213 |
Linear |
0.9561 |
0.0391 |
0.0224 |
Lasso |
0.9561 |
0.0391 |
0.0224 |
BPNN |
0.9688 |
0.0330 |
0.0215 |
RandomForest |
0.9441 |
0.0441 |
0.0237 |
SVM |
0.9323 |
0.0486 |
0.0239 |
Tianjin |
SVM |
0.9669 |
0.0546 |
0.0260 |
Linear |
0.9628 |
0.0579 |
0.0266 |
Lasso |
0.9683 |
0.0535 |
0.0252 |
BPNN |
0.9629 |
0.0578 |
0.0266 |
RandomForest |
0.9660 |
0.0553 |
0.0264 |
ANFIS |
0.9825 |
0.0399 |
0.0234 |
Guangdong |
ANFIS |
0.9895 |
0.0353 |
0.0170 |
Linear |
0.9823 |
0.0452 |
0.0217 |
Lasso |
0.9824 |
0.0451 |
0.0217 |
BPNN |
0.9812 |
0.0466 |
0.0221 |
RandomForest |
0.9850 |
0.0415 |
0.0205 |
SVM |
0.9806 |
0.0479 |
0.0202 |
Shenzhen |
ANFIS |
0.9779 |
0.0455 |
0.0262 |
Linear |
0.9710 |
0.0523 |
0.0266 |
Lasso |
0.9707 |
0.0526 |
0.0268 |
BPNN |
0.9709 |
0.0525 |
0.0270 |
RandomForest |
0.9742 |
0.0494 |
0.0250 |
SVM |
0.9709 |
0.0525 |
0.0269 |
Hubei |
ANFIS |
0.9726 |
0.0634 |
0.0419 |
Linear |
0.9680 |
0.0692 |
0.0420 |
Lasso |
0.9678 |
0.0694 |
0.0420 |
BPNN |
0.9683 |
0.0689 |
0.0417 |
RandomForest |
0.9677 |
0.0695 |
0.0413 |
SVM |
0.9685 |
0.0687 |
0.0420 |
注:加粗数据表示所有预测模型中评价指标值最优。
4.3. 贡献度的异质性分析
贡献度分析用于识别输入变量对输出的贡献程度,以便更好地理解系统的行为。ANFIS的变量重要性贡献度算法如下式:
(16)
其中,
代表在ANFIS模型下第i个变量对碳市场收益率的贡献度,
代表所有样本的第i个变量值(
),
代表所有样本数据在ANFIS模型下的预测值,
代表变量
与
的协方差,
代表代表变量
的方差。
Figure 6. Contributions in the ANFIS model based on four indicators
图6. 基于四个指标的ANFIS模型中的贡献度
图6给出了ANFIS模型中四个指标对碳试点市场的贡献度。从图6中可以看出,Amihud非流动性指标对各个碳试点市场的收益率有正向预测作用,即Amihud非流动性越大(流动性越差),碳市场未来期望收益会越高。Zhang和Han [5]选取了中国八个碳试点市场利用滞后五阶的横截面模型证实了个体碳市场的流动性不足会对第二天的横截面碳收益率产生正向预测作用。我们的结论与上述结果一致,可以进一步看出,Amihud非流动性对于各个碳试点市场的贡献度大小相差不大,在深圳试点中,流动性不足相对于其他三个变量对碳市场收益率更有正向预测作用。我们进一步考察了测度流动性方面的交易量,交易量指标对各个碳试点市场的收益率也有正向预测作用,此外,Amihud非流动性与交易量对未来各个碳试点市场收益率的影响强度相差不大,在北京和深圳试点中,Amihud非流动性和交易量是预测未来碳市场收益率的主要因素。
市场碎片化对碳市场收益率的影响具有明显的异质性效应。市场碎片化对北京、上海、广东和湖北试点的碳市场收益率表现出显著的正向影响,对天津和深圳试点的碳市场收益率表现出显著的负向影响。在湖北和广东试点中,这两个试点的变量贡献度有一定的相似之处,市场碎片化相对于其他三个变量会有更大的贡献度。一方面,市场碎片化对碳市场收益率有正向影响的广东试点来说,广东是碳试点市场运营时第一个将拍卖作为配额分配方式的试点碳市场,在配额拍卖方案上进行了细致的休整,配额拍卖不强制性要求控排企业参与,并允许机构投资者参与竞拍和市场交易,同时还创新型设计了当拍卖底价大幅下调时使用阶梯底价的模式。所以,广东试点中可调整和可支付的排放配额比例较大,可能会促进覆盖主体和投资者的投资热情,市场碎片化相对于其他三个变量更能对广东碳市场收益率有正向影响,从而促进收益率的提高。另一方面,市场碎片化对碳市场收益率有负向影响的天津试点来说,相对于其他试点来说,天津试点的交易量少,不活跃,当市场碎片化增高时,非流动性会变低,对碳市场收益率有负向影响。
根据图6,我们发现中国经济政策不确定性对不同的碳市场价格收益率的影响具有明显的异质性效应。中国经济政策不确定性对上海、广东和湖北试点的收益率表现出显著的正向影响,对于北京、深圳和天津试点的收益率表现出显著的负向影响。对于这个实证结论的解释是因为投资者在经济形势不明朗的时期,更倾向进入相对稳定的且与金融市场相关性不高的碳市场,从而能正向增加碳市场收益率。一方面,经济政策不确定性对碳市场收益率有正向影响的上海试点来说,上海试点具有最稳定的运营体系,是唯一履约率均达到100%的市场,此外,上海试点将碳交易主体的信用管理与社会信用管理平台进行联通,这项举措可以对参与碳市场的控排单位、投资者、核查机构、交易机构等各个利益相关方形成了强有力的约束,并保证碳市场的平稳运行。可以看出,在经济政策不确定性高的情况下,投资者更倾向在这样“稳”的碳试点市场进行交易,从而正向促进碳市场收益率。另一方面,经济政策不确定性对碳市场收益率有负向影响的北京试点来说,北京碳交易市场的制度建设最为细致,北京碳交易市场是独立制定行政处罚自由裁量权、抵消管理办法、公开市场操作管理办法等政策的试点,并且拥有最为丰富的碳排放强度基准线制定经验。可以看出,北京试点的碳交易制度的完善度不会轻易受经济政策不确定性因素的影响。这说明经济政策不确定性是碳市场的一个重要的影响因素,政府在运行全国统一的碳排放权交易市场时,需要考虑经济政策不确定这一因素对碳排放权交易价格的收益率的影响,确保充分发挥碳市场交易的信号功能,引导企业以最小成本实现减排目标。结果支持了H2。
5. 稳健性检验
机器学习模型在训练时通常会表现出极高的准确度,但在新数据上进行预测时可能会出现误差。这是因为模型在训练时可能学习到训练数据中的噪声或特定特征,并以此作为预测规则。通过改变训练数据和测试数据可以检验模型对不同数据的适应能力,有助于增强模型的泛化能力和稳健性。本文将各个碳试点市场训练数据:测试数据从8:2改为9:1来进行稳健性检验。其中,各个碳试点市场90%的数据用于样本内预测,10%的数据用于样本外预测,评估模型指标依旧选择样本外
、均方根误差(RMSE)和平均绝对误差(MAE)来综合比较模型的预测效果。ANFIS与线性回归(Linear)、Lasso回归、反向传播神经网络(BPNN)、随机森林(RandomForest)、支持向量机(SVM)对比,得到的样本外预测精度结果如表4所示,可以看到ANFIS模型拥有最佳的样本外预测效果。通过比较各模型间的样本外预测精度可得出与上文较为相似的分析结果,说明本文构建的预测模型具有一定的稳健性。
Table 4. Robustness test
表4. 稳健型检验
Pilots |
Model |
Performance Criteria |
|
RMSE |
MAE |
Beijing |
SVM |
0.8943 |
0.1398 |
0.0905 |
Linear |
0.8970 |
0.1380 |
0.0891 |
Lasso |
0.8968 |
0.1381 |
0.0889 |
BPNN |
0.8918 |
0.1415 |
0.0909 |
RandomForest |
0.8991 |
0.1365 |
0.0845 |
ANFIS |
0.9176 |
0.1192 |
0.0858 |
Shanghai |
SVM |
0.9571 |
0.0345 |
0.0208 |
Linear |
0.9596 |
0.0335 |
0.0202 |
Lasso |
0.9596 |
0.0391 |
0.0202 |
BPNN |
0.9588 |
0.0338 |
0.0207 |
RandomForest |
0.9601 |
0.0333 |
0.0204 |
ANFIS |
0.9758 |
0.0299 |
0.0204 |
续表
Tianjin |
ANFIS |
0.9876 |
0.0338 |
0.0215 |
Linear |
0.9611 |
0.0612 |
0.0240 |
Lasso |
0.9611 |
0.0612 |
0.0240 |
BPNN |
0.9604 |
0.0618 |
0.0246 |
RandomForest |
0.9661 |
0.0571 |
0.0236 |
SVM |
0.9657 |
0.0575 |
0.0232 |
Guangdong |
ANFIS |
0.9850 |
0.0429 |
0.0205 |
Linear |
0.9838 |
0.0434 |
0.0191 |
Lasso |
0.9838 |
0.0435 |
0.0191 |
BPNN |
0.9831 |
0.0444 |
0.0210 |
RandomForest |
0.9834 |
0.0440 |
0.0188 |
SVM |
0.9838 |
0.0435 |
0.0192 |
Shenzhen |
ANFIS |
0.9841 |
0.0384 |
0.0231 |
Linear |
0.9821 |
0.0402 |
0.0233 |
Lasso |
0.9820 |
0.0403 |
0.0231 |
BPNN |
0.9822 |
0.0400 |
0.0234 |
RandomForest |
0.9819 |
0.0404 |
0.0228 |
SVM |
0.9823 |
0.0400 |
0.0232 |
Hubei |
ANFIS |
0.9690 |
0.0679 |
0.0441 |
Linear |
0.9637 |
0.0734 |
0.0431 |
Lasso |
0.9637 |
0.0735 |
0.0430 |
BPNN |
0.9637 |
0.0734 |
0.0432 |
RandomForest |
0.9636 |
0.0736 |
0.0428 |
SVM |
0.9636 |
0.0735 |
0.0433 |
注:加粗数据表示所有预测模型中评价指标值最优。
6. 结论与建议
本文在综合考虑了我国碳市场的特点以及发展状况的基础上,选取了北京、广东、天津、上海、湖北和深圳六个碳试点市场交易数据对碳市场收益率进行预测。本文时间段选择为2014年1月1日至2022年6月17日,以交易量、市场碎片化、流动性及中国经济政策不确定性指数作为影响碳市场收益率的四个变量,并使用ANFIS模型对其进行建模和预测。最后与其他机器学习的方法作比较,并且运用多种评价方法检验模型效果,提高模型评估的全面性,我们发现ANFIS模型在预测碳市场收益率上效果最好。此外,引入的中国经济政策不确定性这一因素有利于对碳排放权交易市场价格的影响,确保充分发挥碳市场价格的信号功能,引导企业以最小成本实现减排目标。这些发现为政策制定者和市场参与者提供了重要的实证依据和决策支持,促进了可持续发展和低碳经济的实现。最后,相关组织应在明确定义的基础上联合开发新的碳金融产品。这将有利于激发各参与主体的投资热情,提高碳市场的流动性,从而满足更多的潜在市场需求,提高碳市场的运行效率。
基金项目
国家自然科学基金(项目批准号:52472368)。
NOTES
1万德数据库http://www.wind.com.cn/。
2经济政策不确定性https://economicpolicyuncertaintyinchina.weebly.com。