On the Machines as Subjects—Based on the Uninterpretability of Machine Learning
With the rapid development and widespread application of artificial intelligence, discussions on the subjectivity of machines have gradually become a critical issue at the intersection of philosophy and technology. This paper begins by analyzing the independence and uninterpretability of content generated by machine learning, establishing this as its foundation and point of departure. On this basis, it reexamines the “Chinese Room” thought experiment and the problem of other minds, arguing that intelligent machines are increasingly regarded as a unique kind of subject in human understanding. By exploring the transformation of human-machine relations—from instrumentalism to domestication, and ultimately to enslavement—and the potential reversal of master-slave dynamics, the paper highlights the rise of subjectivity within these interactions. Furthermore, it forecasts the future trajectory of human-machine relations under this trend, emphasizing that the conceptualization of machines as subjects is not a distant futuristic scenario but a present reality shaped by technological advancement and application. The study aims to deepen understanding of subjectivity and the evolving dynamics of human-machine relations, calling for profound philosophical reflection and construction to address ethical and legal challenges brought about by artificial intelligence, and to provide philosophical guidance for the development of future human-machine interactions.
Machine Learning
近年来,人工智能相关话题随着人工智能技术的发展和在各个领域的广泛应用而备受关注,关于机器主体性的讨论和研究也在广泛开展并取得了巨大进展,人们对相关问题认识有了长足进步。不过人工智能的概念本身比较含混模糊,相关的技术细节又非常复杂,现有哲学领域的相关研究也常常只是泛泛地讨论人工智能而难以涉及现实的具体技术。此外,现有的讨论多关注强人工智能、超图灵机这些对遥远未来的抽象设想,对现实中已经获得广泛应用并产生重大影响的革命性技术重视程度不高。
实际上人工智能是包含了诸多子领域的交叉科学,而机器学习是人工智能的核心子领域,也是使得作为主体的机器真正成为可能的关键技术。本文将聚焦于机器学习的不可理解这一关键点,指出机器已经开始在不同的意义上作为主体,并讨论作为主体的机器何以可能。
参考机器学习领域权威专家Mitchell的说法,机器学习就是“计算机利用经验自动改善系统自身性能的行为”
普通的计算机程序只是人类逻辑的算法从自然语言的形式最终转化为机器语言的形式,每一段指令都来自人类,不论是在怎样的平台实现,其本质都是人的逻辑的不同形式。而机器学习的革命性正在于出现了并非来自人的指令,这些内容不再是由人的逻辑直接转化而来的,而是从数据中学习得到的,是真正的机器自己的逻辑。虽然正如人的逻辑可以转化为编程语言一样,机器学习的模型的逻辑可以通过编程语言表述,而对于具备专业技能的人而言编程语言又是可理解的,所以如果是在内容不多也不复杂的情形下人类依旧可以通过直接阅读具体内容以理解这样一种并非来自于人的逻辑。但这种理想情况在现实中却显然是不可能的。OpenAI曾在2020年详细介绍了GPT-3的架构、训练过程和性能,提到了GPT-3模型的规模为1750亿个参数
底层结构复杂且不透明的机器学习模型,其输入和输出之间对人类来说真正成为了“黑盒(Black Box)”,没人能确切地知道黑盒中的逻辑,更遑谈确保作为输出的识别结果或决策可靠。正是由于建立在机器学习之上的人工智能系统背后的运作逻辑难以理解,或许会存在不某些确定的风险,使得用户难以完全信任经过黑盒得到的结果。这种现实应用上的困难推动了机器学习的可解释性研究。
但必须要清楚,可解释性研究并不能从根本上彻底解决黑盒不可理解的问题。可解释的人工智能Explainable Artificial Intelligence (XAI)并不意味着可直接理解的人工智能。此意义上的可解释性(explainability)指使用解释作为人类和智能模型之间的中介,作为模型代理能够被人类所理解,倾向于指代原模型不可理解,而需要构造事后模型进行解释。从作用上讲,可解释性是人类与模型之间的接口,它既是那些不可理解的模型的代理,又是人类所可以理解的
约翰·塞尔(John Searle)提出了“中文屋”(the Chinese room argument),认为即使人工智能可以同人类进行文字交流,也正如一个不懂中文的人在房间内通过查阅中文语句间的对应规则用自己拼凑的中文语句回应房间外传递来的中文语句,这并不意味着人工智能真的拥有了理解能力。
首先要指出,约翰·塞尔的中文屋实际上是把黑盒类比为一个内部有规则手册和一个不懂中文的人的房间。但是如前文所说,由于机器学习的不可理解,实际上我们无从得知黑盒内部的结构。故而黑盒和中文房间的类比本身只是对黑盒的一种预设,不能真实反映黑盒的内部结构更不能以此解释人工智能的运作机制。其次,中文房间内不懂中文的人在黑盒内不必然有逻辑结构上的对应者,因为不懂中文的人只是中文房间内的一个部分,没有作为独立的个体和房间外直接接触,而黑盒内部结构却不为人知。所以,真正和人工智能黑盒在逻辑结构上处于同一位置的是中文房间整体而不是中文房间内不懂中文的人,传入房间的纸条对应对黑盒的输入,传出房间的纸条对应黑盒的输出结果,而房间外的人也正如我们对黑盒一无所知一样,对房间内也一无所知。
建立起新的对应关系之后,中文屋的问题可以被表述为一种对图灵测试的诘问:只根据输入和输出判断机器是否具有智能何以可能?不难看出,这正是他心问题的一个翻版,或者说是不仅涉及到了他人的心灵,也涉及到了那些非人对象的心灵的广义的他心问题
虽然有一种观点认为,人工智能的应用会改变他心问题的困局
首先,这种特殊形式的他心问题即机器的他心问题被提出、被讨论这一现象本身实际上标志着在现实中智能机器已经开始被看作主体。因为他心问题的提出和讨论实际上建立在将他人看作主体的事实上,时间上人们先将他人看作另一主体然后才反思地提出他心问题,逻辑上人们处理他心问题是尝试为将他人看作主体的现实寻找理论的基础。类似的,上世纪“中文屋”的提出也以图灵测试(通过对话判断机器智能)相关理论的出现和流行为前提。当然在此意义上的将机器看作主体不意味着被看作主体的机器实际存在,这还只是假言中的存在、想象的存在而非现实的存在。但是能够通过图灵测试的机器在今天已然实现,至少是已经接近实现,正如近来的一项实验中,有54%的参与者将GPT-4误认为是真人,而真人被正确辨认的比例则为67%
更突出的问题是现有的处理他心问题的理论难以将机器和人区分开。例如类比推论方案(Analogical Inference Solution, AIS):我的某一特定心理活动导致了我做出某一特定行为,又可以观察到他人做出了和我特定行为类似的行为,由以上两点推出他人也具有和我类似的心理活动
针对他心问题,我们不应去追求那种既不存在,也是不可能的绝对无误、具有普遍必然性的知识
传统的工具论将机器视为一般工具,理解为扩展身体器官行为的方式的纯粹客体,这显然已经不再适用。在计算机出现之前,还可以说机器不过是为了某种特定目的根据物理规律设计并使用的复杂工具,甚至在机器学习出现之前的计算机也只是对人的逻辑设计进行了物理执行和呈现,其每一条指令都是来自人类的逻辑,只是经由自然语言转换为编程语言并最终落实到机器语言的物理实现。换言之,包括以往的机器和早期计算机在内的工具的设计完全内在于人,逻辑上是先经历了人的构思然后才被实现,或者说是被发明出来的。此外,工具一般意义上的使用则是经历了人结合目的对工具进行分析后才实现的。所以传统工具论中,机器一方面是完全由人构造的,一方面又是被所人理解的,对于发明者是内在自知的,对于使用者也是可知的。但如前文所说,一方面机器学习的原理使得程序中出现了不直接来自人的逻辑,另一方面这些不来自人的逻辑往往数量极其庞大又极端抽象复杂。所以,人类无法再对(智能)机器像一般工具那样从人类设计的角度采取内在透明化的理解,也无法根据人类使用的需要采取外在分析通达彻底的理解。
由于传统工具论难以适用到智能机器,一种将人机关系类比为人与动物关系的机器家畜论被提出和广泛讨论。家畜论认为弱人工智能与人类的关系更像是动物(尤其是家畜)与人的关系,将人类与动物的关系也被视为人类与人工智能关系的样板
在这样的境地下将人机关系类比为主奴关系的机器奴隶论或许更能描述出现阶段的人机关系。主人之所以是主人,奴隶之所以是奴隶,正是因为主人对奴隶的支配和奴隶对主人的依附,是因为其处于这种关系中,而非只是由于奴隶和主人本身的如理性能力、语言能力的差别。人类是机器的主人,机器是人类的奴隶,这正是现实的人机关系的一种写照,这一方面体现了现阶段人机关系中人的主导,另一方面也承认了机器的智能和相对的独立性。把机器看作人类的奴隶正是因为机器已经开始被看作主体,因为奴隶虽然在主奴关系中不具有独立主体性,但是其本身被作为能思维、能认识也能实践的主体认识。机器身为奴隶在人的支配之下,仍然有其工具作用的一面,机器的行动是人的意志的贯彻事实上也是人的行动,但是机器完成人支配的行动的过程本身也是一种独立意识的体现。所以机器虽然在现实的和人的关系中沦为奴隶,服从于人的支配而不具有独立的主体性,但是已经有了一种在人机关系中获得主体性的可能性。今天在金融决策、交通管理等各领域,智能机器的优势愈发凸显,人类逐渐依赖机器来执行操作和进行指导甚至做出决策。另一方面,人类在互联网获取的信息是智能机器通过数据采集和分析后经过筛选才提供给人的。可以看到,人类对信息的获取、一些复杂问题的决策都或多或少被机器所掌控。人类通过智能机器接触世界,通过机器进行认识也通过机器开展实践,人类生活的方方面面已经在很大程度上依赖着机器变得间接化,而机器却在实实在在地“亲自”认识世界、改造世界。在现实中人对智能机器的依赖越来越高,智能机器已经开始作为中介阻隔人和世界的直接联系,人已经在一定程度上开始被机器架空了。所以说不需要等到所谓的“强人工智能”或是“超图灵机”问世,人和机器像黑格尔主奴辩证法里那样的主奴关系倒转今天就已经悄然开始了。
在这种人机主奴关系的基础上,人机关系又将会何去何从?有悲观的观点认为,机器最终会完全取代人的主体地位,人类的命运将取决于超级智能机器。这实际上是人机主奴关系的彻底倒转,机器直接认识世界改造世界,最终在人机关系中获得独立的主体性;而人类渐渐只是享受机器运行的结果,只是接受机器提供的信息,最终变得只能服从于机器,彻底沦为奴隶甚至是家畜亦或最终走向物种的终结。对于这样的结果还有不同的理解,有种超越人类中心主义的观点认为“智能机器人以人类‘继承者’的身份自觉或非自觉地登上历史舞台,成为虚实结合的宇宙中的新一代主宰;人类则在残酷无情的生存竞争中败下阵来,沦为生物进化历程中的一个阶段性的辉煌。”
未来人机关系会如何发展?机器能在关系中取得怎样的主体性?这在今天是值得我们深思的问题。但只有不再泛泛将智能机器等同于更复杂的传统工具,直面机器学习不可理解的黑箱并承认现实人机关系中机器主体性的不断上升,才能对这近在眼前的问题进行有意义的思考和讨论。
由机器学习生成的、不来自于人的逻辑真正赋予了人工智能以可能,但这种机器学习的不可理解也带来了认识上的黑盒。从机器学习的运用开始,智能机器便不再以透明化的姿态出现在我们眼前,而是成为了一种本身不能被直接认识的“他心”,所能被测试的终究只能是智能的表现而非智能本身。所以从人的认识看,智能机器早已作为假言的主体被讨论,而从输入和输出端判断机器智能的图灵测试已经开始被突破,机器似乎已不得不在认识中开始被当作现实存在的主体。同时机器学习的不可理解也使得智能机器超越了一般工具,现有的智能机器在多个领域上甚至有着远超于人的表现,当今社会人对机器的依赖更是前所未有。从人机关系看,智能机器的发展同时也伴随着机器主体性的上升,智能机器不像一般工具那样完全不具备主体性,今天机器已经可以被看成是具备了一定主体性的奴隶,同时智能机器今天仍然在高速发展也意味着其主体性还会进一步上升。
近些年人工智能高速发展和得到广泛应用后,一系列相关问题接踵而至,如自动驾驶、智能决策和信息茧房的伦理及法律问题等都亟待解决,而在这些问题上,形而上的基础建构还落后于现实的需求。本文旨在强调作为主体的机器不是想象中遥远的强人工智能或超图灵机时代的特有物而是自上世纪机器学习运用以来就随着不可理解的黑盒现实存在着,并且其主体地位还会获得更进一步的确立,只有认识到并立足于这一当下现状和发展趋势才能开展有助于解决问题的哲学讨论和哲学建构。