1. 问题提出
1.1. 沃森实验及其扩展
条件推理是一种最常用的演绎推理形式。条件推理有四种常用的基本形式,即肯定前件式(modus ponens,简称MP);否定前件式(denying the antecedent,简称DA);肯定后件式(affirming the consequent,简称AC);以及否定后件式(modus tollens,简称MT)。其中MP和MT是有效的逻辑推理形式,DA和AC是无效的逻辑推理形式。人们如果接受DA和AC就意味着他们犯了逻辑错误。Evans的研究发现,人们对于MP推理形式几乎都表示接受,接受比率近100%,对于MT推理形式的接受比率为75%;无效推理形式DA和AC的接受比率分别达到了69%和75% (Evans, 1996)。这组数据耐人寻味的地方是:无效的推理形式AC竟然得到与有效的推理形式MT相同的支持率。
沃森实验(Wason, 1968, 1966)是关于条件推理的典型范式。在沃森实验中,要求被试看四张卡片,卡片一面是字母,一面是数字。同时,主试给被试提出这样一条规则“若卡片的一面是元音字母,则另一面是偶数”,要求被试说出为了证明或者推翻这一规则的真伪,必须翻看哪些卡片。

Figure 1. Materials of Wason’s Selection Task
图1. 沃森实验材料
如图1所示,选择卡片“E”是MP (肯定前件式);选择卡片“F”是DA (否定前件式);选择卡片“4”是AC (肯定后件式);选择卡片“7”是MT (否定后件式)。四种可能的选择对应于充分条件假言推理的四种可能的逻辑模型,实验设计简单明了,实验方法堪称经典。在此实验中,MP和MT是正确选择,也就是说选择“E”和“7”这两张牌能够证明上述规则的真伪;DA和AC是错误选择,也就是说,翻看“F”和“4”这两张牌不能证明上述规则是否正确。结果发现,只有约4%的人做出了正确的选择,即认为应该翻看卡片“E”和“7”。46%的被试认为应该翻看卡片“E”和“4”,33%的被试认为应该翻看卡片“E”。其中,每张卡片被试翻看的比例分别为“E”100%,“F”21%,“4”33%,“7”50%。卡片“E”和“7”都是正确选择,但是个体在选择的比例上却出现了很大的差别,有研究者认为是因为人们有证实倾向,也就是说个体更倾向于证实某种假设或原则,而很少去证伪它们。另一方面,因为对卡片“7”(否定后件式)进行认知加工时,个体需要用到更多的认知资源,需要在给定前提的基础上增加“否定”这个步骤,这样增加了个体的认知加工的负荷,这些都影响到了个体在对卡片“7”的认知加工中,从而影响个体在选择卡片“7”上的正确率。蔡曙山认为,以上解释不足以说明MP的100%的支持率和其他选择的心理偏差。他提出,MP是一种先天逻辑能力,是先天遗传的,是正确思维的人都可以掌握的,是不需要学习的。而错误的推理形式AC之所以得到与正确的推理形式MT相同的支持率,是因为溯因推理(abduction)的思维方式发生了作用。因此,越是习惯于使用溯因推理的人群,其对AC的支持率越高(蔡曙山,2013)。
此外,后续也有观点认为,卡片作业中的错误与实验材料的性质有关。由于实验采用了比较抽象的、符号化的材料,因而导致了错误。如果把卡片的内容换做被试熟悉的事物,被试的正确选择比率就会明显提高。Cosmides和Tobby (1992)将需要证实的规则换做这样的表述:“若有人喝啤酒,则该人的年龄必超过19岁”(四张卡片见图2)。实验任务要求被试通过四张卡片的选择来检查非法饮酒者,和前面的沃森实验一样,正确答案是卡片“喝啤酒”和“16岁”。其中选择卡片“喝啤酒”是肯定前件(MP),选择卡片“16岁”是否定后件(MT),选择卡片“喝可乐”是否定前件(DA),选择卡片“22岁”是肯定后件(AC)。结果表明,采用这种与被试生活经验相关的材料,有高达74.1%的被试做出了正确的选择。

Figure 2. Materials of extended Wason’s Selection Task
图2. 沃森扩展实验材料
1.2. 工作记忆
Baddeley和Hitch (1974)在模拟短时记忆障碍的实验基础上提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。Baddeley认为工作记忆指的是一个系统,它为复杂的认知过程比如言语理解、学习和推理等活动提供了临时的储存空间和加工时所必需的信息处理场所,这样工作记忆系统就能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。工作记忆分成三个子成分,分别是中枢执行系统、视觉空间加工系统和语音环路。大量行为研究和神经心理学上的许多证据支持了三个子成分的存在,有关工作记忆的结构和作用形式的认识也在不断地丰富和完善。人们发现工作记忆与语言理解能力、注意及推理等联系紧密(Handley, Capon, Copp, & Harper, 2002)。
1.3. 沃森实验与工作记忆
有研究者认为逻辑推理、问题解决和言语理解等高水平的认知活动都依赖于工作记忆系统(Handley, Capon, Copp, & Harper, 2002)。工作记忆容量与逻辑推理的执行水平是密切相关的。已有研究也证实了工作记忆资源对这些任务的执行起着关键性的作用(De Neys, 2006)。高工作记忆容量的被试比低工作记忆容量的被试在更大程度上拒绝AC和DA,同时更高频率的接受逻辑上有效的MP和MT (De Neys et al., 2005a)。Colom et al. (2004)研究发现,工作记忆容量高的被试更容易成功地完成抽象且没有上下文联系的推理任务,但有研究者从发展角度对此现象进行的研究却得出了不一致的结论,研究发现工作记忆容量低的儿童在进行推理时,有时候表现为比成年人更有逻辑性(De Neys & Vanderputte, 2011)。
人类推理被认为是自动的信念支持系统(系统1)和有需求的逻辑支持系统(系统2)的相互作用结果。根据双加工理论,系统1的加工可能会引起被试的非理性思维,产生非理性偏差。工作记忆参与系统2的加工,它会抑制非理性的偏差使得人们做出正确的推理。因此,高工作记忆容量的被试更有能力抑制非理性加工而取得更好的推理成绩,低工作记忆容量的被试则更容易受非理性加工的影响从而产生较差的推理成绩(De Neys, Schaeken, & D’Ydewalle, 2005b)。但是,Gigerenzer和Gaissmaier (2011)认为,个体和组织经常依赖于简单的启发式思维来做出决策,这是一种适应行为,与权衡所有信息相比忽视部分信息往往更容易得出精确的决策,这似乎表明工作记忆的作用受到了限制。De Neys和Schaeken (2007)研究表明,在有认知负荷的情况下,实用型推论的比率减少,而逻辑性推理的比率增加。
本研究中,我们认为工作记忆容量是影响MT选择的一个重要因素,并且假设工作记忆会抑制非理性思维产生的偏差,工作记忆容量高将会有助于被试做出更正确的推理。为了验证这种假设,我们通过重新施测沃森实验及沃森扩展实验,同时对被试的工作记忆容量进行测量来验证工作记忆容量是否会影响被试在沃森实验及沃森扩展实验中的推理选择。同时,研究中采用PID量表对被试的分析/直觉型思维方式进行进一步的测试和验证。
2. 研究方法
2.1. 研究对象
57名清华本科生,没有接受过逻辑训练,平均年龄19.47岁,其中男生35名,女生22名。
2.2. 研究材料
1) 沃森实验
共有四张卡片,卡片一面写有字母,另一面写有数字。若存在这样一条规则“若卡片的一面是字母‘E’,则另一面为数字‘4’。为了证实这条规则的真伪,请问必须翻看哪些卡片?(见图1)
2) 沃森实验扩展
共有四张卡片,卡片一面写有年龄,另一面写有饮品。若存在这样一条规则“若有人喝啤酒,则该人的年龄必超过19岁”。为了证实这条规则的真伪,请问必须翻看哪些卡片?(见图2)
3) 运算广度测量
采用Turner和Engle (1989)等人开发的运算–词汇广度测验编制。测验的理论依据是工作记忆广度的加工与存储双功能模型,要求被试在判断算式正误的同时记住算式后面的词汇,如“2 * 1 + 6 = 7?时间”。这些算式是从Cantor和Engle (1993)的研究中所选取,正确与错误的算式各占一半。词语是选择现代汉语双频字典中的高频词。全部工作记忆广度任务包含60项运算–词汇任务,这些任务有5种组合方式,依次为2、3、4、5、6,每种组合连续呈现3次。这样全部测验需要被试回忆15次,要求回忆词汇的数目依次为2、2、2;3、3、3;4、4、4;5、5、5;6、6、6。被试15次能够正确回忆的词汇总数作为工作记忆广度的成绩,范围为0~60。
4) PID量表
采用PID (修订版,Betsch, 2004)问卷对被试的直觉/理性风格进行测量。该问卷共18道题,其中PID-I和PID-D分量表各9道题。PID-I为直觉分量表,PID-D为分析分量表,同时该量表可以根据PID-I得分高于平均值且PID-D得分低于平均值的被试为直觉型风格,PID-D高于平均值且PID-I得分低于平均值的被试为分析型风格(见附录)。
2.3. 研究假设
1) 相比于低工作记忆容量的被试,高工作记忆容量的被试更容易正确的选择出MT (否定后件式)这种推理形式。
2) 直觉分数高的被试,在MT选择中更容易出现错误,也就是越容易拒绝MT;分析分数高的被试,更容易正确的选择出MT思维形式,也就是越容易接受MT。
2.4. 实验程序
实验前告知被试整个实验的进程,让其对实验的过程有所了解。首先,进行沃森实验及沃森扩展实验测试。要求被试看沃森实验的四张卡片,卡片一面是字母,一面是数字。同时告知被试,存在这样一条规则:“若卡片的一面是E,则另一面是4”,为了证明这条规则的真伪,需要翻看哪些卡片,请被试将答案写在纸上。然后要求被试看沃森扩展实验的四张卡片,需要证实的规则换做“若有人喝啤酒,则该人的年龄必超过19岁”,为了证明这条规则的真伪,需要翻看哪些卡片,请被试将答案写在纸上。
进行工作记忆广度测验:屏幕上将出现一个算式,算式后紧跟着一个词语。算式的结果有正确的,也有错误的,要求被试判断算式的结果是否正确。如果正确,则用左手按Q键,错误则用右手按P键。在按键的同时要记住后面的词语。每个算式呈现的时间为5秒。5秒后算式将消失,出现新的算式,被试继续做出判断,直至屏幕上出现“???”的时候,需要在纸上写出先前所记忆的词语。告诉被试在进行回忆的时候尽量要按顺序进行,如果实在不能按顺序进行,能回忆多少就写多少。被试能够正确回忆出来的词语的总数作为此测验的成绩,即工作记忆广度的成绩。
施测PID量表。被试需要对呈现的语句进行判断,判断其与自身情况的符合程度。
2.5. 数据处理
采用SPSS19.0对研究数据进行分析统计。
3. 研究结果
3.1. 结果描述
3.1.1. 沃森及其扩展实验中各个选择的人数分布
如图3所示,在沃森及其扩展实验中,接受MP的被试人数最多,分别为56名(98.25%)和55名(96.49%);接受DA的被试人数最少,分别为3名(5.26%)和1名(1.75%)。在沃森实验中,接受AC和接受MT的被试人数相同,都是19名(33.33%);在沃森扩展实验中,接受MT的人数多于接受AC的人数,分别为38名(66.67%)和7名(12.28%)。
3.1.2. 工作记忆容量及分析/直觉得分
从表1中我们可以看到,选择卡片“E”和“7”的被试相比于没有选择该卡片的被试,在分析量表上得分较高,在直觉量表上得分较低。而选择卡片“F”和“4”的被试相比于没有选择该卡片的被试,在分析量表上得分较低,在直觉量表上得分较高。
如表2所示,在选择卡片“16岁”的被试与没有选择该卡片的被试相比,工作记忆容量较大,分析得分较高,直觉得分较低。
MP:选择“E”或“喝啤酒”;DA:选择“F”或“喝可乐”;AC:选择“4”或“22岁”;MP:选择“7”或“16岁”
Figure 3. The population distribution of Wason’s Selection Task and extended Wason’s Selection Task
图3. 沃森及沃森扩展实验中各个选择的人数分布(%)

Table 1. Means of working memory capacity and intuition/analytical in Wason’s Selection Task
表1. 沃森实验中各个选择的工作记忆容量及分析/直觉平均得分
MP:选择“E”;DA:选择“F”;AC:选择“4”;MP:选择“7”。括号内为标准差。

Table 2. Means of working memory capacity and intuition/analytical in extended Wason’s Selection Task
表2. 沃森扩展实验中各个选择的工作记忆容量及分析/直觉平均得分
MP:选择“喝啤酒”;DA:选择“喝可乐”;AC:选择“22岁”;MP:选择“16岁”。括号内为标准差。
3.1.2. 沃森及其扩展实验与工作记忆
对不同选择下被试的工作记忆容量进行统计分析发现,只有在沃森实验中,选择卡片“7”的被试的工作记忆得分与没有选择卡片“7”的被试的工作记忆得分之间存在显著差异,t = 2.38,p < 0.05。也就是说,选择卡片“7”,即选择MT时的被试与没有选择卡片“7”的被试的工作记忆得分之间存在显著差异。选择卡片“7”的工作记忆容量的得分平均值为55.11,不选择卡片“7”的工作记忆容量的得分平均值为50.92,所以,我们可以说选择卡片“7”的工作记忆容量得分显著高于不选择卡片“7”的工作记忆容量,也就是说,接受MT的工作记忆容量显著大于拒绝MT的工作记忆容量。
在沃森实验中,选择卡片“E”、“F”和“4”,即MP、DA和AC推理选择时,被试工作记忆得分之间均不存在显著差异,p > 0.05。
在沃森扩展实验中,工作记忆容量在各个卡片选择中均不存在显著差异,p > 0.05。也就是说,MP、DA、AC和MT推理选择中,工作记忆容量均不存在显著差异。
对不同选择之间的工作记忆容量进行统计分析,结果发现:在沃森扩展实验中,四个选项之间的工作记忆容量之间存在显著差异,F(3,98) = 8.94,p < 0.01。事后检验发现,选择卡片“喝啤酒”和“22岁”的被试的工作记忆容量以及选择“22岁”和“16岁”的被试的工作记忆容量之间存在显著差异,p < 0.01。选择“喝啤酒”、“22岁”和“16岁”的被试的工作记忆容量平均得分分别为52.15、50.14和53.05,也就是说,选择“喝啤酒”的被试的工作记忆容量显著高于选择“22岁”的被试;选择“16岁”的被试的工作记忆容量显著高于选择“22岁”的被试的工作记忆容量。结果说明,在沃森扩展实验中,接受MP的被试的工作记忆容量显著高于接受AC的被试,接受MT的被试的工作记忆容量显著高于接受AC的被试。
3.1.3. 沃森及其扩展实验与直觉/分析
对不同选择下被试的直觉与分析得分进行统计分析,结果发现,只有在沃森实验中,选择卡片“4”或“7”,也就是在进行AC或MT推理时,分析或者直觉的得分之间会存在显著差异。
在分析分量表中,对被试是否选择卡片“4”的得分进行比较,t = 2.56,p < 0.05,存在差异显著,也就是说被试选择卡片“4”与被试不选择卡片“4”的情况下,被试在分析分量表的得分中存在显著差异。而在直觉分量表中,被试是否选择卡片“4”其直觉得分之间不存在显著差异。选择卡片“4”的分析得分平均值为32.94,不选择卡片“4”的分析得分平均值为36.16,所以,我们可以说选择卡片“4”的分析得分显著低于不选择卡片“4”的分析得分,也就是说,接受AC的分析得分显著低于拒绝AC的分析得分。这说明在进行AC (肯定后件式)推理时,较少使用分析思维而较多地使用直觉思维,其成绩更好。
在被试是否选择卡片“7”的情况下,t = 2.33,p < 0.05,差异显著,也就是说被试选择卡片“7”与被试不选择卡片“7”的情况下,被试在直觉分量表的得分中存在显著差异。而在分析分量表中,被试是否选择卡片“4”其直觉得分之间不存在显著差异。选择卡片“7”的直觉的得分平均值为26.47,不选择卡片“7”的直觉的得分平均值为29.59,所以,我们可以说选择卡片“7”的直觉得分显著低于不选择卡片“7”的直觉得分,也就是说,接受MT的直觉得分显著小于拒绝MT的直觉得分。这说明在进行MT推理时,较少地使用直觉思维而较多地使用分析思维,其成绩更好。
在沃森实验中,选择卡片“E”、“F”,即选择MP和DA推理选择时,被试分析/直觉得分之间均不存在显著差异,p > 0.05。
在沃森扩展实验中,对不同选择下被试的直觉与分析得分进行统计分析,结果发现,在沃森扩展实验中,分析和直觉分量表的得分在各项选择中不存在显著差异,p > 0.05。
3.1.4. 性别差异
对不同性别在不同选择上的差异进行检验发现,不同性别的被试只有在沃森扩展实验中,选择“16岁”这张卡片时存在显著差异,t = 2.17,p < 0.05,而在选择其他卡片中不存在显著差异。其中,男生的平均分为0.77,女生的平均分为0.50,也就是说,相比于女生,男生更倾向于选择“16岁”这张卡片。
4. 讨论
在沃森实验中,选择卡片“E”(MP)的被试56名(98.25%);选择卡片“F”(DA)的被试3名(5.26%);选择卡片“4”(AC)和“7”(MT)的被试都是19名(33.33%)。这与100%,75%,69%,75% (Evans, 1996) 的比例有一定的偏差,特别是卡片“F”的选择,本研究中只有5.26%的被试选择了这张卡片,与沃森实验的21%有比较的大的差异。我认为原因有字母“F”在推理前提中没有被表征过,会影响被试对它的选择,选择它的比例会减少;另一方面,本研究中选择的是清华的本科生,其学习能力比较强,其推理能力可能会好于其他人,因此选择“F”的可能性也会比平均水平低一些。
而在沃森扩展实验中,选择卡片“喝啤酒”(MP)的被试55名(96.49%);选择卡片“喝可乐”(DA)的被试1名(1.75%);选择卡片“22岁”(AC)的被试7名(12.28%);选择卡片“16岁”(MT)的被试38名(66.67%)。这与本研究中沃森实验的成绩98.25%,5.26%,33.33%,33.33%相比,有了显著提高。我们发现,实验材料的经验性和熟悉程度是影响被试正确选择一个重要因素。当实验材料换做被试熟悉的生活资料时,被试的正确选择的比率显著提高了。我们发现,当实验材料换做被试比较熟悉的生活资料时,被试更大程度上拒绝逻辑上无效的AC和DA,同时更大程度上的接受逻辑上有效的MP和MT。这可以说明,实验材料是影响被试正确选择一个重要因素。这主要是因为,当实验材料是被试所熟悉的时候,被试可能运用生活经验进行非逻辑思维就可得到答案,并且,因为实验材料符合人们的实际生活经验,被试可能不需要进行过多的思考。而当实验材料是被试所不熟悉的字母数字,并且并不符合被试的生活经验时,被试需要进行逻辑思考来推理出正确答案,这就需要使用更多的认知资源,从而发生更多的推理偏差。
在沃森实验与工作记忆容量的检验中我们可以看到,是否选择“7”(否定后件式,MT)的被试的工作记忆容量的大小之间有显著的差异,接受MT的工作记忆容量显著大于拒绝MT的工作记忆容量,这与研究假设是相符的。这与De Neys,Schaeken和D’Ydewalle的研究结论是一致的,高工作记忆容量的被试比低工作记忆容量的被试在更大程度上拒绝AC和DA,同时更高频率地接受逻辑上有效的MP和MT (De Neys, Schaeken, & D’Ydewalle, 2005a, 2005b)。这说明高工作记忆容量可以抑制个体的非理性思维,促使个体做出更正确的推理选择。但是,本研究并没有发现被试在接受MP,拒绝AC和DA中有显著的差异,这可能是因为MP为最简单的推理形式,而AC和DA为非正确推理形式。
在沃森实验中,不同思维方式会影响被试是否会选择卡片“7”(否定后件式,MT)具体表现在:直觉得分高的被试更有可能不选择“7”,拒绝MT,而直觉得分低的被试倾向于接受MT,选择“7”。这与前面我们得出工作记忆容量的被试更倾向于接受MT,而低工作记忆容量的被试更倾向于拒绝MT的结论是一致的。因为高工作记忆容量会抑制被试的非理性思维,使被试更理性的运用分析思维,更倾向于接受MT。另一方面,结果中我们也可以看到,不同思维方式会影响被试是否会选择卡片“4”(肯定后件式,AC)。具体表现为,分析得分高的被试更有可能不选择“4”,拒绝AC,而分析得分低的被试倾向于接受AC,选择“4”。在前面的工作记忆容量的检验中我们并没有发现这种差异,被试是否选择卡片“4”的工作记忆容量之间并不存在显著的差异。但是,这与De Neys, Schaeken和D’Ydewalle的研究中的结论一致,认为高工作记忆容量的被试比低工作记忆容量的被试在更大程度上拒绝AC和DA,同时更高频率地接受逻辑上有效的MP和MT。这也就是说,直觉得分高而分析得分低的被试是在右脑思维,在进行较复杂的推理(MT)时,其成绩较差;反之,直觉得分低而分析得分高的被试是左脑思维,在进行复杂推理时,其成绩较好。同时,高工作记忆容量有利于进行逻辑推理,因为左脑认知需要占用更多的认知资源;而低工作记忆容量的被试则更多的使用节约认知资源的右脑思维。左右脑的分工和不同工作模式统一解释了以上实验结果。
在沃森扩展实验中发现,不同选择之间的工作记忆容量之间存在显著差异,具体来说是,接受MP比接受AC的工作记忆容量高,接受MT比接受AC的工作记忆容量高。MP和MT是有效的推理形式,而AC是无效的推理形式,接受有效推理比接受无效推理的被试的工作记忆容量高,也就是说,接受有效推理的被试的工作记忆容量高于接受无效推理的被试的工作记忆容量,这与已有研究结果一致。
在沃森扩展实验中,在对工作记忆和分析/直觉量表得分的统计分析,在不同选择中均不存在显著差异。相较于沃森实验,沃森扩展实验中将实验材料换做被试熟悉的生活资料的内容,被试在进行推理时,不需要像沃森实验一样进行抽象的推理,只需要结合生活场景以及生活经验就可以做出正确的选择,所以工作记忆容量及分析\直觉在扩展实验中不存在显著差异。
只有在沃森扩展实验中,选择卡片“16岁”(MT)时存在性别差异,相比于女生,男生更倾向于选择卡片“16岁”,进行MT推理。男生更善于进行左脑思维,而女生更倾向于进行右脑思维。在进行复杂推理MT时,需要占用更多的认知资源,相较于左脑思维,节约认知资源的右脑思维则会成绩较差,也就是女生在进行MT推理时的成绩比男生差。
5. 结论
沃森实验中,选择卡片“7”(即接受MT)的被试的工作记忆容量显著高于未选择卡片“7”(即拒绝MT)的被试的工作记忆容量。
沃森实验中,选择卡片“7”(即接受MT)的被试的直觉得分显著低于未选择卡片“7”(拒绝MT)的被试的直觉得分;选择卡片“4”(即接受AC)的被试的分析得分显著低于未选择卡片“4”(即拒绝AC)的被试的分析得分。
在沃森扩展实验中,并没有发现工作记忆容量或者分析/直觉得分在不同选择下存在显著差异。
附录
PID量表(部分)
请根据您在生活中的实际情况,判断以下说法与您自身的符合程度。请选择最能代表您想法的数字:1代表“很不符合”,2代表“不太符合”,3代表“不确定”,4代表“有点符合”,5代表“很符合”。
1. 在做决策之前,我会进行全面的思考。
2. 我会认真体会自己内心深处的感受。
3. 在做决策之前,我会先想想要达成的目标是什么。
4. 在很多情况下,我认为完全依靠直觉来做决定很奏效。
5. 我不喜欢那些需要凭直觉的状况。
6. 我经常自我反思。
7. 比起顺其自然,我更喜欢制定周密的计划。
8. 我喜欢凭感觉以及对人性的理解和生活的阅历来做决定。
9. 我的感觉在我的决策中发挥重要作用。
10. 我是个完美主义者。