1. 引言
在生存分析研究中,Cox比例风险模型因其参数估计的便捷性和稳健性,成为分析删失数据的首选方法,尤其在比较组别差异时,Cox模型展现出较高的准确性。然而,在比较不同治疗组的效果时,研究者往往更关注平均寿命的差异。由于研究持续时间总是有限,生存时间分布通常会呈现明显的右偏,从而导致估计的结果不够准确。在此背景下,Irwin [1]首次提出了限制均值寿命的概念,即从0到L的平均寿命。近年来,许多研究表明,当风险呈现比例关系时,通常以风险比(HR)作为疗效评价指标。Karrison [2]将这一概念扩展到不同治疗效果的比较中,在没有协变量的情况下,可以通过计算治疗组的Kaplan-Meier生存曲线在区间
上的面积来直接估计;引入协变量后,通常通过建立独立风险回归模型来考察协变量对风险函数的影响,从而估计限制均值寿命。在随机删失假设下,Chen和Tsiatis [3]在研究随机删失条件下的治疗不平衡问题时,基于两种Cox比例风险模型估计了两组间限制均值寿命的差异,并通过计数过程中的鞅理论推导了该估计量的大样本性质。
生存数据通常存在右删失,因此一般假设失效时间和删失时间相互独立。然而,在实际场景中,感兴趣的生存时间和删失时间可能是相关的,这种情况称为相依删失。以乳腺癌为例,随着筛查的普及和治疗水平的提高,年轻乳腺癌患者的死亡率显著下降,而老年乳腺癌患者往往因心脏疾病、肺部疾病或脑血管疾病等慢性基础疾病去世,而非乳腺癌本身。这导致我们关注的死亡时间被删失。如果在统计分析中忽略了其他疾病与患者死亡的相关性,可能会导致估计偏倚。因此,在分析过程中,合理处理删失已成为一个重要问题。为了解决这一问题,Zhang和Schaubel [4]通过结合特定组的Cox比例风险模型和逆概率删失加权(IPCW)的方法,用于估计非随机分组情况下的限制均值寿命差异,并验证了其在有限样本中的适用性。裴艳波和厉金洪[5]在随机删失和相依删失同时存在的情形下,基于相依删失加性模型估计限制均值寿命的差异以评估处理效应。这些研究在处理删失数据时取得了重要进展,但未充分考虑协变量不均衡可能带来的混杂因素。
在观测性研究中,感兴趣的因素通常是非随机分配的,因此治疗组之间的协变量不均衡可能会导致混杂影响。为确保疗效比较的准确性,本文结合了协变量修正和删失数据处理方法。首先,利用倾向得分的协变量修正法来消除混杂影响;其次,通过逆概率删失加权法调整相依删失对估计的影响;最后,基于相依删失的比例风险模型对处理效应进行估计。第2节介绍模型和方法,第3节将所述方法应用于实例分析,最后一节为结论部分。
2. 模型与方法介绍
2.1. 模型与符号
假设感兴趣的事件是比较非随机分组的两组
在时间L内的限制均值寿命。为此,定义变量T表示个体的生存时间,并采用Rubin [6]以及Zhang和Schaubel [4]所使用的潜在结果模型来描述不同处理组的效果。令
表示假设个体接受治疗组
(其中
)时的潜在生存时间,对应的生存函数记为
。由于每个个体不能同时接受两种处理,因此无法同时观测到
和
。因此,定义
为实际观测到的生存时间,其中
为示性函数。接着,定义处理效应为两组在时间L内的限制均值寿命的期望差异,具体为:
其中
表示第a组在时间L内的限制均值寿命的期望值。
在非随机试验研究中,个体的分组并不是随机的,这就导致分组变量A和协变量X并不独立,即协变量X是影响生存时间和治疗分配的混杂因素。假设给定协变量X的条件下,生存时间与治疗分配条件独立,即
。在这种情况下,有
因此,可以通过观测数据
的分布来确定平均处理效应
,即
其中
表示基于X的边缘分布求期望,如果能够得到
的估计
,则可以利用样本均值估计上述数学期望,从而估计
,记该估计量为
,即
在生存分析中,生存时间T的删失原因可能不同。本文考虑两种删失类型:在给定
的条件下,若
与T独立,则称为随机删失,记为
;若
与T不独立,则称为相依删失,记为
。这表明生存时间和删失时间可能同时受到时间相关的混杂因素的影响。在实际观测中,对于每个个体,仅能观测到生存时间T,随机删失时间
和相依删失时间
的最小值,记为观测时间
。另外,定义删失指示变量
和
分别表示删失是否发生以及是否为相依删失。设t时刻前所有协变量的历史过程为
,其中
表示时依协变量在u时刻的取值。同时,
包含所有基准协变量X以及与删失变量
相关的潜在预测变量。因此,观测数据可以表示为n个独立同分布的随机向量
。
2.2. 方法步骤
为了得到估计量
,首先需要建立生存分布与处理变量以及协变量之间模型关系。在观测性研究中,由于缺乏随机分配机制,处理组和对照组的协变量分布往往存在差异,从而引入混杂因素。为控制这些混杂因素,常用方法是计算每个个体接受某种处理的倾向得分,并基于此对协变量进行调整,使两组的协变量分布更为接近,从而模拟随机分配的效果。在这里采用协变量修正法,将倾向得分作为协变量引入模型,以进一步控制混杂因素的影响,从而提高估计的准确性。
首先,使用logistic回归模型来估计倾向得分,即个体接受处理的概率。在给定协变量
下,倾向得分的定义为
,其中
是回归系数。因此,倾向得分的对数模型为:
。从而,个体i的倾向得分可表示为:
(1)
这里,
是协变量
和回归系数
的函数,表示在给定
下接受处理的概率。为了估计参数
,我们通过最大化对数似然函数
,得到参数的估计值
。于是,倾向得分的估计量为:
。在后续分析中,将
简写为
。
在得到倾向得分后,可以将其作为协变量引入Cox比例风险模型,以进一步分析生存时间和处理变量之间的关系,控制混杂因素的影响。Cox模型表示为:
其中
,
。此模型允许在两种处理情况下基线风险率和与协变量相关的回归系数相同。
在仅存在随机删失
的情况下,分析如何估计模型参数。为得到累积基准风险函数
和回归系数
的相合估计,定义个体在t时刻或之前观察到的死亡人数为
,其风险过程定义为
。因此,鞅过程可表示为:
,其中
。然后,通过以下估计方程可以得到参数
和
的解:
由于
,
,
,可以证明
为零均值鞅过程。因此,可以通过下面的估计方程得到
和
的相合估计。这里假设存在一个特定时点
满足
,在实际情况中,
可以选择最大观察时间。因此,可以使用最大似然估计方法和Breslow [7]估计量来估计累积风险函数
和参数
。Breslow估计量表示为:
在存在相依删失
的情况下,给定
时
与T不独立,因此
不再是零均值过程。为消除相依删失的影响,通常采用“无未观测混杂因素”假设,即假设观测数据的历史过程
是
和
之间相关性的唯一依赖因素,满足
,且不受未来的观测影响。定义相依删失时间
的风险函数为:
累积风险函数可以表示为
。在此假设下,Robin和Finkelstein [8]利用重期望公式证明了
,其中函数
可以看作到相依删失时间不发生的逆概率权重,用以调整相依删失带来的偏倚。不过,
的值在时间t趋于研究结束时可能变得非常大,导致估计不稳定。为消除这种影响,引入权重稳定因子
,并定义权重函数
。当
时,为非稳健方法。而对于稳健方法,可取
,其中
,且定义
对于
的估计,可通过类似的估计方法获得。容易证明
。接下来,通过逆概率删失加权(IPCW)估计步骤来得到无偏估计,其估计方程为:
其中
。基于此,可得到对应的加权Breslow估计量
在实际应用中,
是未知的,因此需要对其进行建模和估计。为了拟合相依删失
的模型,将
作为删失时间,
表示观察到删失时间
的示性函数。这里依然考虑较为灵活的Cox比例风险模型对
进行建模,从而获得较为稳健的估计。具体地,拟合特定组的Cox比例风险模型:
(2)
其中
表示相依删失时间
的特定组风险函数。通过该模型,可以得到
和
的估计,从而计算出权重估计量
。可以通过类似的方法估计出稳定因子
,只需将
替换为
和
即可。
在估计出参数
和累积风险函数
后,可计算对照组和处理组的生存函数:
(3)
其中,
表示个体i在
(对照组)或
(处理组)条件下的生存函数。最后,计算得出两个处理组的限制均值寿命差异
的估计量
(4)
3. 实例分析
本文利用SEER数据库中的70岁以上女性浸润性乳腺导管癌手术患者的临床资料,共有2610名患者,其中2048名患者接受了联合治疗(即化疗联合放疗),其余562名患者接受了单一治疗(仅化疗)。研究的目的是探讨在L年间,联合治疗组和单一治疗组在平均寿命方面是否存在显著差异,以评估不同治疗方案的效果差异。具体研究变量和定义见表1。
为了估计感兴趣的参数,以trt (治疗方式)为响应变量,选择年龄、肿瘤总数、TNM分期、M分期和her-2为协变量,根据公式(1)建立如下logistic回归模型:
Table 1. Research variables and definitions
表1. 研究变量及定义
研究变量 |
定义 |
分类 |
time |
观测时间 |
1~119个月 |
status |
独立删失 |
0:死于其他疾病或删失 |
1:死于该疾病 |
status0 |
相依删失 |
0:死于该疾病或删失 |
1:死于其他疾病 |
trt |
治疗方式 |
0:单一治疗 |
1:联合治疗 |
age |
年龄 |
70 岁及以上 |
tumor |
原位/恶性肿瘤的总数 |
1,2个 |
stage |
TNM分期 |
1,2,3,4期 |
M |
M分期 |
M0:无远处转移 |
M1:有远处转移 |
her-2 |
人类表皮生长因子受体2 |
阴性:IHC 0、IHC 1+或者IHC 2+且FISH阴性 |
阳性:IHC3+或者FISH阳性 |
该模型用于估计患者接受联合治疗或单一治疗的概率,模型回归结果见表2。
Table 2. Results of the Logistic regression model for joint treatment selection
表2. 联合治疗选择的Logistic回归模型结果
|
Estimate |
Std. Error |
z value |
Pr (>|z|) |
(Intercept) |
3.361 |
0.898 |
3.744 |
0.0001 |
age |
−0.019 |
0.012 |
−1.598 |
0.1200 |
tumor |
−0.229 |
0.103 |
−2.228 |
0.0259 |
stage |
−0.137 |
0.075 |
−1.816 |
0.0693 |
M |
−1.257 |
0.331 |
−3.793 |
0.0001 |
her2 |
−0.169 |
0.103 |
−1.640 |
0.1011 |
表2中回归结果表明,肿瘤数量和M分期显著影响患者选择联合治疗的概率,尤其是M分期的影响显著(P = 0.0001),表明无远处转移的患者接受联合治疗的可能性较低。肿瘤数量也表现出显著的负面影响(P = 0.0259)。尽管患者年龄和her-2 状态的影响未达到显著性水平(P值分别为0.1099和0.1011),但接近显著水平,提示这两个变量可能在治疗选择上具有一定影响。TNM分期的影响也接近显著水平(P = 0.0693),表明可能对治疗选择产生一些作用。综合来看,肿瘤数量和远处转移是决定乳腺癌患者是否接受联合治疗的主要影响因素,而年龄、TNM分期和her-2状态的影响相对较小。
为了进一步判断各协变量是否与相依删失有关,从而确保分析的准确性和稳健性,我们以观测时间(time)作为响应变量,并使用相依删失指示变量(status0)来标记删失情况。同时,将年龄(age)、肿瘤总数(tumor)、TNM分期(stage)、M分期和人类表皮生长因子受体状态(her-2)五个变量作为协变量,根据公式(2)建立Cox模型来检验与相依删失的相关性。具体结果如表3所示。
Table 3. Results of the Cox regression model with dependent censoring
表3. 相依删失的Cox回归结果
|
coef |
exp (coef) |
se (coef) |
z |
Pr (>|z|) |
age |
0.0832 |
1.0868 |
0.0135 |
6.1720 |
6.73e−10 |
tumor |
0.8805 |
2.4121 |
0.1196 |
7.3630 |
1.79e−13 |
stage |
−0.0031 |
0.9969 |
0.0932 |
−0.0330 |
0.9739 |
M |
1.2588 |
3.5212 |
0.4208 |
2.9920 |
0.0028 |
her2 |
0.0183 |
1.0184 |
0.1273 |
0.1430 |
0.8859 |
表3显示,年龄、肿瘤数量和M分期对相依删失时间具有显著影响(P值分别为6.73e−10、1.79e−13和0.0028),而TNM分期和her-2状态无显著影响(P值分别为0.9739和0.8859)。因此,在后续分析中,将年龄、肿瘤数量和M分期作为时依协变量,以提高处理效应估计的准确性。
接下来,通过逆概率删失加权法构建Cox比例风险模型,以估计联合治疗组和单一治疗组的限制均值寿命及其差异,从而比较两种治疗方式的效果。将因其他疾病导致的死亡时间视为相依删失时间
,并对其建立Cox模型,先计算相依删失的累计风险函数
,从而估计逆概率删失权重
,其中
,
和
分别表示治疗方式以及三个时依协变量。
最后,基于2.2节所述的方法,可以通过公式(3)稳健地估计生存时间T的生存函数,并根据公式(4)得到联合治疗组与单一治疗组在1至10年内的限制均值寿命
及其差异
。此外,为了进一步验证估计结果的稳健性,使用未进行协变量修正的逆概率删失加权法估计治疗效应进行对比分析。对比结果详见表4。
表4展示了联合治疗组和单一治疗组患者在不同限制时间L下的限制均值寿命
和
,以及两组之间的治疗效果差异Δ,并通过bootstrap法重复抽样1000次得到治疗效果差异Δ的标准误(Se)。表4分别列出了利用倾向得分修正和未利用倾向得分修正的治疗效果差异的估计结果,利于分析和评估倾向得分修正对治疗效果的影响。
由表4可见,限制时间L较小时,联合治疗组与单一治疗组的治疗效果差异Δ均不显著。从
起,无论是否进行倾向得分的修正,治疗效果差异均达到显著水平,且修正后的显著性水平更高。随着限制时间L的增加,联合治疗组与单一治疗组的治疗效果差异Δ显著扩大。在
时,未修正的估计值为
,修正后的为
;到
时,未修正的估计值增至
,修正后的为
。这表明利用相依删失的统计方法处理该数据是适合的,联合治疗在延长患者寿命方面的效果随时间推移进一步增强,特别是在限制时间较长时表现得更加明显,并且利用倾向得分修正能够更清晰地体现联合治疗的效果。Bootstrap结果表明,经过倾向得分修正后,降低了治疗效果差异估计的标准误,且变化平稳。由此可见,倾向得分修正减小了混杂因素的干扰,使治疗效果差异更为显著,同时在减少随机误差和提高估计稳健性方面展示出优势,为更可靠地评估治疗效果提供了支持。
Table 4. Estimation of treatment effect difference (Δ) for different L values
表4. 不同L取值下治疗效果差异Δ的估计量
|
Unadjusted |
Adjusted |
L |
|
|
Δ |
|
|
|
Δ |
|
1 |
0.909 |
0.800 |
0.109 |
0.072 |
0.896 |
0.814 |
0.081 |
0.061 |
2 |
1.592 |
1.411 |
0.181 |
0.129 |
1.672 |
1.434 |
0.238 |
0.117 |
3 |
2.175 |
1.767 |
0.408 |
0.165 |
2.310 |
1.812 |
0.498 |
0.142 |
4 |
2.571 |
2.048 |
0.524 |
0.195 |
2.805 |
2.011 |
0.795 |
0.167 |
5 |
2.966 |
2.243 |
0.724 |
0.216 |
3.152 |
2.118 |
1.034 |
0.193 |
6 |
3.292 |
2.307 |
0.985 |
0.235 |
3.336 |
2.144 |
1.192 |
0.216 |
7 |
3.458 |
2.323 |
1.135 |
0.254 |
3.439 |
2.153 |
1.286 |
0.219 |
8 |
3.575 |
2.360 |
1.215 |
0.252 |
3.509 |
2.157 |
1.352 |
0.227 |
9 |
3.688 |
2.380 |
1.307 |
0.276 |
3.558 |
2.160 |
1.399 |
0.234 |
10 |
3.765 |
2.400 |
1.365 |
0.281 |
3.594 |
2.161 |
1.433 |
0.237 |
此外,数据还显示,在每个时间点上,联合治疗组的限制均值寿命均高于单一治疗组,且差异随着限制时间延长进一步扩大。特别是在长期疗效上,联合治疗展示出显著优势,其效果主要体现在通过放疗有效控制局部复发,同时增强化疗的全身疗效,最大程度地消除癌细胞。尤其是在局部复发风险较高的患者中,联合治疗的效果尤为突出。因此,联合治疗不仅在统计学意义上更优,其临床意义也非常明确,适合广泛推广应用。
4. 讨论
本文针对同时存在随机删失和相依删失的情况,采用限制均值寿命来比较两组的效应差异。通过构建logistic回归模型来修正协变量,以解释处理组间潜在的混杂因素。针对两类删失带来的混杂效应,分别采用两个不同的比例风险模型进行解释,并结合固定权重的逆概率删失加权法,估计限制均值寿命的处理效应差异。为简化计算过程,我们直接将逆概率权重的估计值代入估计公式中,视其为固定值处理,这种方法可能导致置信区间相对保守。
基金项目
本研究由2022年度辽宁省研究生教育教学改革研究项目(2022-180-39510165)资助。
NOTES
*通讯作者。