中国科学院哲学研究所与复旦大学智能科学与智能哲学研究中心于9月15日与9月22日联合邀请当代著名的科学哲学家、2017年古根海姆基金会奖金获奖者、美国纽约大学哲学系中最有影响力学者之一的迈克尔·斯特雷文斯(Michael Strevens),在线讲解他的新书《知识机器:非理性如何塑造科学》。本文回顾9月22日讲题为“知识机器和科学中确证理论的角色”的讲座内容,共享哲学加科学之胜。


知识机器和科学中确证理论的角色

中国科学院哲学所 CASIP 国际系列讲座一
2021年9月22日(周三)19时
迈克尔·斯特雷文斯

斯特雷文斯主讲内容

本场讲座的主题是科学哲学中的传统领域——确证理论(confirmation theory)

我们首先讨论证据支持(evidential support)。证据支持的关键问题是:基于科学理论的证据如何支持某一科学理论优于其竞争对手,或者反对某些理论使其被淘汰。在科学哲学中,由于历史的原因,证据支持经常在确证理论中被提及。确证理论考察特定的证据是否支持或反对给定的理论,如果是,在多大程度上支持或反对。

有两种研究确证理论的进路。一种被称为人类学(anthropological)进路,它探讨的是证据支持在科学表述中实际上如何运作的问题。具体而言,它把科学家视作发现并评估证据的人,通过民族志(ethnographical)的方法研究科学家记录和处理证据的方式。采用这种进路的有很多著名的科学哲学家,包括卡尔·亨普尔(Carl Hempel)。另一种非常不同的,更哲学化的进路是逻辑进路。它从第一性原理出发,询问证据支持应该如何起效,以及证据支持的恰当逻辑(correct logic)是什么。在科学哲学中,贝叶斯主义者采取这一原则。

我想要做的是更仔细地考察亨普尔对证据支持的论述,他在指出了科学家实际行动中的有趣特征。亨普尔在1940年提出了确证的例示理论(the instantialist theory of confirmation),主张证据支持的基本单位是实例。亨普尔认为,能直接确证一个理论,如“所有F是G”的证据,要么是“一个是F的东西也是G”,要么是“一个东西不是F”。当一则证据确证了另一蕴含给定理论的假说,二者间的关系称为间接确证。例如,一只在美国被观察到的黑色渡鸦能直接确证“所有渡鸦都是黑色的”,并间接确证了“澳大利亚的所有渡鸦都是黑色的”。亨普尔的理论为任何逻辑形式的假说给出了直接确证的标准。

亨普尔理论的优点在于:它给出了直接确证任意逻辑形式之假说的标准,并解决了一个类似理论的固有矛盾。其局限在于:它是纯粹定性的,不能给出证据支持理论的程度有多强;它仅允许关于可观察对象的理论被确证。其关键点是:1、纯定性理论;2、忽视理论的超经验优势(super-empirical virtue),包括理论的简洁性、统一性和优雅;3、忽视认知语境(epistemic context),背景知识在亨普尔的理论中没有任何地位。

按照当代科学哲学界的通常理解,亨普尔提出的理论只是片面概括了确证活动。而我今天的论点是:上述理解是错误的。实际上,科学实践中确证的工作方式或多或少都有亨普尔式的特征。

下一步,我要对需要给出关于理论的证据的场合作出区分。科学论证散见于各色场景:科学期刊、会议论文、科学家的反思,实验室会议,科学家和公众交流等。它们可以被分为两组。第一种是给出正式科学论证(official scientific argument)的场合,包括科学期刊和会议论文,是科学家与同侪进行交流的正式途径。另一种是非正式的私人科学推理(private scientific reasoning)的场合,最主要的是科学家自己的反思。两种场合有着截然不同的证据支持结构。一方面,在私人科学推理中,可以量化证据支持的强度,可以将超经验优势和各种认知语境纳入考虑。然而在正式科学论证中,证据支持是更加亨普尔式的,它不对证据进行量化,无视超经验优势和认知语境。

在讲座中我会从以下方面来为我的论点进行辩护。

1. 证据支持是非量化的。容易想到的问题是在科学发表中确实存在相关的量化指标,例如p值、其他显著性测试,以及在观察实验中印证理论预言的概率。但正如科学哲学家所知,这些数值并不足以决定证据支持的强度。为得到这些数值需要一系列的假设,例如实验仪器工作正常,没有实验假象,没有未知的干扰等等。假设的合理性对计算证据支持的强度是必要的,但是通常这些数字并不会在科学发表中被报告。在科学论文中存在的是证据,以及它是如何产生的,又如何被理论所预测和解释。科学论文中的数字,逻辑关联和证据的描述允许读者以私人科学推理的方式评估证据,但是这些步骤在科学论文中并没有完成。

2. 无视超经验优势。在此我想讨论一种超经验优势——理论的美或者优雅。许多理论物理学家经常谈论理论的美,他们将美视作超经验优势,用以支持某些理论。其中有三位对美的价值作出了非常强的断言。保罗·狄拉克(Paul Dirac):“方程中存在美比符合实验更重要。” 默里·盖尔曼(Murray Gell-Mann):“美是选择正确假说的主要判断依据。” 史蒂文·温伯格(Steven Weinberg):“我们不会接受一个不美的理论作为终极理论。”如果我们接受这些论断,意味着当我们考虑哪些理论值得被认真对待时,对数据解释的优美将会是评估中的重要因素。

在布莱恩·格林(Brian Greene)的《宇宙的琴弦》The Elegant Universe中,我们会发现相似的叙述。格林称,物理学家以美感——关于哪些理论与我们的经验世界同等优雅和美丽的感觉——来决定和判断研究的方向。但是在几页之后,格林继续写道:“审美判断并不能对科学话语作出仲裁。理论是由它们在面对坚实的实验事实时是否成功所决断。”诺贝尔奖不会因一个理论的优美和公认的合理性为其颁奖,除非有实验证据支持。非常显著的例子是从希格斯玻色子的理论提出到其因实验验证而获奖之间有数十年之久。在公开发表的科学文献中,美不能作为对理论的支持理由,只有成功的预测和解释才可以。即使是在理论物理学的论文中,所包含的也是经验证据对理论的确证,而不是理论如何优美。

在书中我作出了以下论断,科学文献无视超经验优势不仅令人惊异地与许多哲学家所说相悖,而且它是非理性的。我已经表明,对物理学家来说,美对选择合适的理论很有帮助。同时,他们承认,在正式科学论证中“美”这一对评估证据支持如此有帮助的特质是不被注意的。正式科学论证无视了一种有效的、容易利用的信息来源。这是对哲学家所称的完全证据原则(the principle of total evidence)的公然的、直接的抵触。该原则是指,当思考时,要考虑所有可以利用的信息来源,只要它们相对于目标而言代价没有过大。尽管哲学家都知道超经验优势很重要,科学家们也都承认,但是它们依然被无视了。这确实有一点疯狂。

既然公共科学论证有这样的特征,它是否是一种有社会学意义的混乱?到底是科学即使在一团混乱中仍然取得了巨大的成功,还是恰恰是因为这种混乱科学才取得了成功?可能你期待的科学论证的规则能够规范科学家的思维方式,提出比我们日常思维更加理性和形式化的归纳逻辑。但是你实际得到的根本不是这样的规则或逻辑,它缺乏证据支持的量化分析,违背全面证据原则。亨普尔意识到了这一点,并且通过他的理论复现了这团混乱。

所以我们应该做什么?是不是要把正式科学论证这一奇怪的、缺少哲学意义的社会学现象丢在一边,接着研究证据支持的归纳逻辑,希望科学家们在私人科学推理中遵循?这是值得投入的工作,但是科学论证为何存在、它们在做什么,仍然值得思考。考虑这样一些有趣的问题:经验证据的一般标准是什么?是否存在展示证据的一般规则?这是在搁置对归纳逻辑的追求后,可以就正式科学论证提出的问题。

接下来我们谈谈科学论证规则的功能。这些规则排除了认知优势并且允许非定量证据。为了接下来的内容,先让我介绍两种候选的功能。一个是客观性(objectivity),一个是动力(motivation)

我开始写《知识机器》的契机,是我在为本科生讲授确证理论时,从亨普尔的理论获得的震撼。我想问:如果确证真的是这样会如何?为什么我们这样构建科学?我的第一想法是存在对客观性的追求。在正式科学论证中追求客观性是如此重要,以至于我们把哲学家认为应该在论文中存在的其他因素都排除了。预测的成功是客观的;美,无论你认为有多重要,是主观的,所以我们在公共科学领域中必须忽略它。

当然,我认为这不可能是真正的过程,因为预测上的成功本身是不客观的。预测的成功依赖于辅助假设的可信程度,如果你要从科学论文中拿掉一切主观的东西,那么就需要拿掉过于主观的辅助假说,此时我们甚至无法得到一个定性(qualitative)的理论。在证据支持的系统中对客观性的追求是适得其反的。由此,正式科学论证的功能就不是追求客观性。

我们再来看另一个关于动力的故事。托马斯·库恩(Thomas Kuhn)认为所有的研究受制于范式对如何做科学的完全指导。科学家沉浸于范式以至于他们无法想象范式会失败,他们认为范式就是做科学的正道。因此,可以专注于极其消耗精力的和昂贵的细节,这些细节给予科学探寻理论缺陷的强大能力,对于科学进展而言是必要的。这个故事很有趣,也很具有说服力。但是在库恩发表《科学革命的结构》的约60年后,我想我们已经知道:尽管范式在科学中很重要,库恩仍然夸大了范式的统一性,普遍性和影响力。

但是我认为库恩洞察到现代科学的部分关键点。那就是现代科学家经常陷入细节,而前现代的思想家对此不会感兴趣。对现代科学来说,细节是决定性的。因此我认为正式科学论证的规则在科学中扮演的动力的角色,正是库恩认为范式所扮演的那种。我认为我们不应该将这些规则当作推理或者决定证据支持程度的规则,而是把它们当作游戏规则。

规则是这样的:直接公开发表证据,不需要定量给出证据对理论的支持程度,只需要给出它与理论的联系;此外,不需要给出哲学的,审美的和其他超经验的论证。科学家通过不断的积累、揭示证据来玩这个游戏。在私人推理中科学家会对证据的重要性进行评估,但是对于正式论证而言,重要的是设定这样一个游戏。

确证理论在以下方面势必是分叉的:1、私人科学推理的逻辑。2、公共科学论证的规则。前者是人类归纳推理的逻辑,它不仅仅是科学哲学的话题;后者是科学所特有的。

评论人与斯特雷文斯问答

Darrell Rowbottom(岭南大学):
关于“经验支持如何在科学言说中发挥作用”,斯特雷文斯欣赏亨普尔的回答:“它使我们忽视超经验优势。”我的主要问题是:关注经验支持的科学言说真的不求助于任何超经验优势吗?至少从经验上或从科学史上来说,存在不少理论借由超经验优势而被选择的例子。

孙永平(北京大学):
如果公开的科学论证无法抓住科学中经验支持的正确逻辑,甚至是非理性的,为什么这些论证在科学共同体中仍然是有效的、有说服力的?公开的科学论证是否仅仅是一种非理性的、不具说服力的公众仪式?换言之,私人科学推理是否才是科学发展背后真正的驱动力?

徐竹(华东师范大学):
如何理解“科学游戏”这一概念?科学中的一些规则像是下棋的规则,但另一些则与下棋的规则相差很远。许多理论对私人科学推理给出了界定,但如何对铁律所重视的公开场合的科学论证作类似界定?

Casper Storm Hansen(中国科学院哲学研究所):
铁律的描述性的方面,尤其是对科学产出的动力的解释具有很强的说服力。但它在规范性主题上却很难令人信服,特别是如下推论:“试图改变科学是非理性的。”是否存在改进科学的方法?

斯特雷文斯回应:
对 Rowbottom 提到的例子,我想说:科学是一种游戏、科学论证的规则是解释的铁律,这一整套概念是一种社会的概念。它会改变,它并非从来便如此,它并不总是被遵守。我在书中也讨论了一些反例,特别是我称之为现代“后经验科学”例子,比如我们是否应当承认可以用经验以外的证据来支持弦论?收集弦论的经验证据实在太贵、太不可能立即获得了。这些例子确实对铁律造成了压力,但它们并未转变我们做科学的方式。我非常欢迎对于铁律似乎被违反的案例的讨论,我们能通过讨论这些论证在科学史中起到的作用来更深刻地理解科学。如果案例表明超经验优点能够常规性地发挥决定性作用,我的理论就失效了,但我的看法是科学整体并非如此。

孙永平问题的关键在于是不是只有私人推理才驱动科学发展?从某些方面——甚至是几乎所有重要的方面——来说,答案是“是的,的确如此”。从智识角度来看,私人推理决定了应当支持哪些理论,应当进行哪些实验,应当发展哪些领域。科学的智识部分发生在科学家的头脑中。但是与此同时,科学游戏也还在进行,并且在动力的意义上同样对科学至关重要。

在此我希望转向徐竹关于科学游戏范围的问题。这个问题中隐含了一个观察:我的理论可能过分夸大了某些部分。我认为我的理论中谈到的这些因素对科学游戏非常重要,但它们不是这个游戏的全部。例如我刚才谈论的私人科学推理表明了我自己在刻画这个游戏时也需要特别小心。当谈论科学整体时,显然还有种种说服、控制甚至马基雅维利式的幕后手段,表明科学不仅仅是个“游戏”。

许多评论人谈到我关于“非理性”的那些断言。我并不是指科学家们被迫用非理性的方式思考,而是说他们遵从表面上看上去非理性的实践习惯。从中我们可以看到科学的内核存在一种张力:一方面,我们有传统的巨大惯性,另一方面,我们有改进和提升游戏的期望。这让我想到 Casper Hansen 关于改进科学游戏的评论。假使我们试图通过设置一场游戏来鼓励某些行为,我们必须应对人类的“狡猾”——总是有人能找到既能满足规则,又对规则试图促进的机制毫无助益的方法。此外我们还面临想要改进某个细节却使整个体系乱作一团的窘境。但是如果我们仔细考察科学游戏规则的演化史,就能发现我在书中和报告中主要刻画的那些没有随时间变化的部分。实验方法或检验标准的改进更多的是局部的改进,但科学整体也许并没有经历显著的规则改变。

两场讲座的线上回放:

知识机器与科学中的动机问题:

https://www.bilibili.com/video/BV1m341127Gc

知识机器和科学中确证理论的角色:

https://www.bilibili.com/video/BV1pq4y1o7MK