第五章 经典世界
  
物理理论的状况 
  
  
  
  为了了解意识如何是自然的一部分,我们对自然的运行要知道哪些呢?制约身体和 
头脑组成基元的定律与此关系重大吗?如果真的像许多人工智能的拥护者所竭力说服我 
们的那样,意识理解仅仅是由算法所规定的,那么这些定律实际上是什么样子的则是无 
关紧要的。任何能够实现算法的仪器都一样好。另一方面,也许我们的知觉比可怜的算 
法更富有内容。也许构成我们的确切方式正和实际上制约构成我们物质的物理定律一样 
重要。我们也许需要理解构成物体物质以及规定所有物体行为的根本性质。物理学尚未 
做到这一步。许许多多的秘密还有待揭示和探索。然而,大多数物理学家和生理学家却 
断言,我们已经拥有足够的关于通常尺度的、诸如人脑物体运作的物理定律的知识。作 
为一个物理系统,大脑毫无疑义是极端复杂的,我们对其结构的大部分细节和相应功能 
相当无知。但是少数人说,人们对作为构成其行为基础的物理原则的理解不存在任何重 
大缺陷。 
  
  相反地,我在下面将持一种非传统的论点,也就是我们对物理学的理解,甚至在原 
则上还不足够用以描述我们大脑的运作。为了论证这一点,我首先必须概述物理学的现 
状。本章是关于所谓的“经典物理”,它包括牛顿力学和爱因斯坦相对论。此处“经典 
”基本上是指在1925年左右发现量子理论之前的占统治地位的理论。量子力学是由诸如 
普郎克、爱因斯坦、玻尔、海森堡、薛定谔、德布罗依、玻恩、约丹、泡利以及狄拉克 
的开创性工作的成果。它是一种不确定的、非决定性的、神秘的、描述分子、原子和次 
原子粒子行为的理论。相反地,经典理论是决定性的,这样,将来总是由过去所完全固 
定。尽管许多世纪以来对经典物理学的理解使我们得到了非常精确的图像,它仍有许多 
神秘之处。我们还必须考察量子理论(在第六章)。因为和大多数生理学家的观点相反 
,我相信量子现象似乎对大脑的运行是相当重要的��这些是下面几章的内容。 
  
  迄今为止科学已取得了引人注目的成就。我们只要环视四周即可见证理解自然帮助 
我们取得了何等伟大的威力。现代世界的技术大多是从大量的经验中推导出来的。然而 
,正是物理学理论以更基本得多的形式成为我们技术的基础。这正是我们在此所关心的 
。我们的理论是相当精确的。但其力量并不仅仅在此,而且在于异乎寻常地遵从精密的 
、微妙的数学处理的这个事实。正是这两者一道为我们带来了威力无比的科学。 
  
  这个物理理论的大部分并不特别新颖。如果首先要挑选一个事件的话,那应该是168 
7年伊萨克·牛顿出版了《原理》一书。这本重要著作向人们展示了,如何仅仅从几个基 
本的物理原理出发,能够理解并经常以惊人的精度预言了大量的物理对象的行为。《原 
理》一书中很大部分是关于数学技巧的非凡的发展,尽管欧拉等人后来提供了实用的方 
法。)正如牛顿所坦率承认的,他自己的工作大大得益于更早期思想家的成果,其中最 
杰出者为伽利雷·伽利略、雷奈·笛卡尔以及约翰斯·开普勒。还用了一些更古老的思 
想家们所奠定的重要概念,诸如柏拉图、欧多索斯、欧几里德、阿基米德以及阿波罗纽 
斯等人的几何概念。我在下面还要更多地说到这些。 
  
  后来出现了对牛顿动力学基本框架的偏离。首先是十九世纪中叶由詹姆斯·马克斯 
韦发展的电磁理论。这个理论不仅包括了电场和磁场,而且还描述了光的经典行为1!此 
一杰出的理论将是本章后面所关注的课题。马克斯韦理论对于今天的技术具有相当的重 
要性,并且毫无疑义地,电磁现象和我们大脑的工作密切相关。然而,和阿尔伯特·爱 
因斯坦名字联结的两种伟大的相对论对我们的思维过程是否具有任何意义,还没有这么 
清楚。亨利·彭加莱、亨德里克·安东·洛伦兹以及爱因斯坦为了解释当物体以接近于 
光速运动时所产生的使人迷惑的行为,从研究马克斯韦方程出发,提出了狭义相对论( 
后来赫曼·闵可夫斯基给出了精巧的几何描述)。爱因斯坦著名的E=mc2方程是该理论的 
一部分。但是迄今为止此理论对技术的影响(除了对核物理的效应之外)甚微,看来它 
和我们头脑工作的关联最多也只是外围的。另一方面,狭义相对论加深了我们对和时间 
本质有关的物理实体的理解。我们将会在后面几章看到,这给量子理论带来一些根本的 
迷惑,这些迷惑和我们对“时间流逝”的感觉有重要关系。况且,人们在鉴赏爱因斯坦 
的广义相对论之前必须理解狭义相对论。广义相对论是用弯曲的空间��时间来描 
述引力。迄今为止此理论对技术的效用几乎是不存在的①,看来极端地假设其对我们头 
脑的功能有何相关真有点异想天开了!然而,值得注意的是,广义相对论的确和我们后 
面特别是在第七章和第八章的思考关系重大。在那里为了探索要获得量子理论首尾一贯 
的图像所必须的一些变动,我们要最彻底地研究空间和时间,��这些在后面还要 
更仔细地讲到! 
  
经典物理学的领域很广阔。量子物理学的情况又如何呢?和相对论不同的是,量子理论 
正开始剧烈地影响技术。其部分原因在于,它为某些技术上诸如化学和冶金等重要领域 
提供了理解。人们的确可以讲,正是因为量子理论赋予我们新的详细的洞察力,才使这 
些领域被包含在物理之中。此外,量子理论还提供了许多全新的现象,我想最熟知的例 
子便是激光。量子理论的某些基本方面会不会在我们的思维过程的物理学中起关键的作 
用呢? 
  
  我们关于更现代的物理学能说些什么呢?一些读者也许会想起那些激动人心的观念 
,包括诸如“夸克”(参阅177页)。“GUT”(大统一理论)、暴涨宇宙论(参阅402页 
的注释13)、“超对称”、“(超)弦理论”等等。将这些方案和我刚才提到的那些相 
比较又如何呢?我们是否也必须通晓这些呢?我相信,为了更清楚地透视,可将基本的 
物理理论分成三大类。我将这三类命名为: 
  
1.超等的, 
  
2.有用的, 
  
3.尝试的。 
  
  本段之前所讨论的一切理论都必须归于超等类中。我并不强求只有该理论无可辩驳 
地适用于世界上的一切现象时才能称为超等的。但是,我要求在适当的意义上,该理论 
适用的范围和精确度必须是显著的。就我所理解的“超等”这个术语而言,居然会有属 
于这一类的理论存在,这真是极其令人惊异的事!我不知在其他科学中是否有理论可以 
归入这一类。也许达尔文和瓦拉斯提出的自然选择庶乎近之,但还差得相当远。 
  
  我们在中学学到的欧几里德几何是一种最古老的超等的理论。古代人也许根本不将 
其当作一种物理理论,但实际上它的确是物理空间以及固体几何的卓越的理论。为何我 
将欧几里德几何归于物理理论而不是数学的一个分支呢?具有讽刺意义的是,现在我们 
知道,欧几里德几何不能当作我们实际生活其间的物理空间完全准确的描述,而这是采 
取这个观点的一个最清楚的原因!爱因斯坦的广义相对论告知我们,在引力场存在时, 
空间(--时间)实际上是“弯曲的”(也就是说不是完全欧几里德型的)。但是这个事 
实并没损坏欧几里德几何的超等的资格。在一米的尺度上,与欧几里德的平坦性偏差的 
确非常微小,它比一个氢原子的直径还小! 
  
  阿基米德,帕波斯和斯蒂文研究静态物体,并将其发展成个漂亮的科学分支--静力 
学,该理论可以合情合理地够格称作是超等的。现在该理论已被牛顿理论所包容。1600 
年左右由伽利略提出,并由牛顿将其发展成美丽的、内容丰富的理论的,研究运动物体 
的动力学的根本观念,应该毫无疑问地纳入超等的范畴。把它应用于行星和月亮的运动 
时,具有惊人的可观察的精确性--其误差比一千万分之一还小。同一个牛顿的方案也以 
相当的精确性适用于地球以及外推到恒星和星系的范围。类似地,马克斯韦理论在向内 
可达到原子和次原子的粒子尺度,向外达到大约大一万亿亿亿亿倍的星系的尺度的异乎 
寻常的范围内准确地成立!(在此尺度的小的那一端,马克斯韦方程必须和量子力学的 
规则适当地合并在一起。)它也肯定够格被称作超等的。 
  
  爱因斯坦的狭义相对论(为彭加莱所预想并被闵可夫斯基非常精巧地表述)对允许 
物体以接近光速运动的现象给出了令人惊叹地准确的描述。牛顿的描述最终在这种情况 
下开始动摇。爱因斯坦的无与伦比漂亮的和开创性的广义相对论推广了牛顿的引力动力 
学理论并改善了它的精确性,继承了牛顿理论处理行星和月亮运动的所有非凡的成就。 
此外,它还解释了各种和旧的牛顿方案不一致的观测事实。其中一个例子(参阅242页的 
双脉卫星的例子)指出爱因斯坦的理论能精确到大约1014分之一。两种相对论--第二种 
将第一种包含了--应该明确地归到超等的类中去(其数学上的优雅几乎和其准确性一样 
重要地作为这分类的原因)。 
  
  由不可思议地漂亮的和革命性的量子力学理论所能解释的现象的范围,以及它与实 
验符合的精度,很清楚地表明它必须归至超等的类中去。迄今尚未找到与该理论在观测 
上的偏差--然而在用该理论解释许多迄今令人费解的现象方面,显示出其威力远远地超 
过这些。化学定律、原子的稳定性、光谱线的狭窄(参阅263页)以及非常特别的花样, 
超导的零电阻的古怪现象以及激光的行为仅仅是其中的几个例子。 
  
  我给超等的分类立下了很高的标准,但这是我们在物理中已经习惯了的。那么,对 
于最近代的理论能说些什么呢?以我的观点看,恐怕其中只有一种或许够格被称为超等 
的,并且它还不是特别新的:即是所谓的量子电动力学(或QED)。它是由约丹、海森堡 
和泡利提出,1926至1934年间由狄拉克所表述,最终在1947至1948年间由贝特、费因曼 
、施温格以及朝永加以改进使之可以应用。这个理论是狄拉克将量子力学、狭义相对论 
、马克斯韦方程以及制约电子自旋和运动的基本方程结合在一起的结果。总的来说,该 
理论缺乏早先的许多超等理论的令人信服的精巧和一致性,但它的资格在于真正惊人的 
准确性。特别值得一提的结果是它给出了电子磁矩的值。(电子的行为类似于一个自旋 
的电荷的微小磁铁。此处“磁矩”即是这小磁铁的强度。)由QED计算出的这一小磁矩的 
值为1.00115965246(以某一单位测量--误差大约在最后二位小数上的20),而最近的实 
验值为1.001159652193(误差大约在最后二位小数上的10)。正如费因曼所指出的,其 
精确度等效于从纽约到洛杉矶之间相差一根头发的宽度!我们没有必要在此了解该理论 
。为了完整起见,我将在下一章的结尾简单地提到它的一些重要的特征①。 
  
  我要将一些现代理论放到有用的范畴中去。有两种理论虽然在这里不需要,却值得 
提及。第一个是称为强子(质子、中子、介子等等组成原子核--或更准确地讲“强相互 
作用”的粒子)的次原子粒子的盖尔曼--兹维格夸克模型以及描述它们之间相互作用的 
详细的(后期的)称为量子色动力学或QCD的理论。其思想是,所有强子都由称作“夸克 
”的部份组成,夸克之间以从马克斯韦理论的某种推广(称为杨--米尔斯理论)的方式 
进行相互作用。第二种理论是由格拉肖、萨拉姆、瓦尔德和温伯格提出的,它又是利用 
杨--米尔斯理论将电磁力和描述放射性衰变的“弱”作用结合起来。该理论对所谓的轻 
子(电子、μ子、中微子;还有W和Z粒子--所谓的“弱相互作用”的粒子)作出统一描 
述。这两种理论有好的实验支持。但是由于种种原因,这些理论远不如人们期望的像QED 
那么清爽,而且它们目前的观测精度以及预言能力离开超等类的惊人的标准还非常远。 
有时将这两种理论(第二种还包含QED)称作标准模型。 
  
  最后,还有另一种我相信至少可归于有用的范畴的理论。这就是称为宇宙的大爆炸 
起源的理论②。此理论在第七章和第八章的讨论中将起重要的作用。 
  
  我认为没有更多的理论属于有用的2范畴。现代(或近代)有许多盛行的观念。它们 
除了“GUT”理论(以及某些从它导出的观念,诸如“暴涨模型”,参阅402页的注13) 
外还有:“卡鲁查--克莱因”理论、“超对称”(或“超引力”)以及还极其时髦的“ 
弦”(或“超弦”)理论。以我之见,所有这些都毫无疑义地属于尝试类中。(参阅贝 
娄1988,克罗斯1983,戴维斯和布朗1988,斯奎尔斯1985)。在有用和尝试类之间的重 
大差别是后者没有任何有意义的实验支持3。但是这并不是说,其中不会有一个将戏剧性 
地升格为有用的甚至超等的范畴去的理论。其中某些的确包含有许多相当有前途的、富 
有创见的思想,但是,可惜迄今仍然没有得到实验的支持,而只停留在观念阶段。尝试 
类是一个非常宽广的范畴。它们其中有些牵涉到包括能导致新的实质性的理解上的进步 
的基因,同时我认为其他的一些肯定是误导的或做作的。(我曾经受不了诱惑,试图从 
可尊敬的尝试类中分出称作误导的的第四类--但是后来我想还是不分的好,因为我不想 
失去我的一半朋友!) 
  
超等的理论主要是古代的,人们不必为此感到惊讶。在整个历史上一定有过多得多的归 
于尝试类的理论,但是多数都被遗忘了。与此相似,许多有用类的理论后来也被湮没了 
;但是也还有一些被吸收到后来归于超等类的理论中。让我们考虑一些例子。在哥白尼 
、开普勒和牛顿提出优越得多的方案之前,古希腊人提出过一个十分精巧的行星运动的 
称作托勒密系统的理论。按照这一方案,行星的运行由圆周运动的复杂组合所制约。它 
能相当有效地做预言,但是在需要更高的精度时,变得越来越繁复。今天我们看来,托 
勒密系统的的人为因素显得非常突出。这是一个有用理论(实际上大约用了两千年)后 
来整个退出物理理论的极好例子,虽然它曾在历史上起超过很重要的组织作用。相反地 
,开普勒的辉煌的椭圆行星运动的观念便是从有用的理论变成我们能见到的最终成功的 
例子。化学元素的门捷列夫周期表是另一个例子。它们并没有提供具有“惊人”特征的 
预言方案,但是后来成为从它们成长出来的超等的理论的“正确”的推论(分别为牛顿 
动力学和量子理论)。 
  
  在以后的章节中,我不再对仅仅归于有用的和尝试的范畴的现代理论多加讨论。因 
为超等理论已足够讨论的了。我们有这等理论,并能以非常完整的方式理解生活其中的 
世界,确实是非常幸运的。我们最终必须决定,甚至这些理论是否足够丰富到能制约我 
们头脑和精神的作用。我将依序触及这些问题;但目前让我们先考虑超等理论并深入思 
考它们和我们目的相关联之处。 
  
  
  
欧几里德几何 
  
  
  
  欧几里德几何即是我们在中学当作“几何”学习的学科。然而,我预料大部分人会 
将其视作数学,而不视作物理。当然,它也是数学。但是,欧几里德几何决不是仅有的 
可以想得出的数学几何。欧几里德传给我们的特殊几何非常精确地描述了我们生活其间 
的世界的物理空间,但这不是逻辑的必然--它仅仅是我们物理世界的(几乎准确的)被 
观察的特征。 
  
  
  
  的确还存在另外称作罗巴切夫斯基(或双曲)的几何①,它大部分方面非常像欧几 
里德几何,但还具有一些有趣的差别。例如,我们记得在欧几里德几何中任意三角形的 
三个角的和为180°。在罗巴切夫斯基几何中,这个和总是比180°小,并且这个差别和 
三角形的面积成比例(见图5.1)。 
  
  著名的荷兰艺术家毛里兹·C·伊歇为这种几何给出了一种非常精细和准确的表象( 
见图5.2)。按照罗巴切夫斯基几何,所有的黑鱼具有相同的大小和形状;类似地,白鱼 
亦是如此。不能将这种几何在通常的欧几里德平面上完全精密地表达出来,所以在圆周 
边界的内缘显得非常拥挤。想象你自身位于该模型的某一靠近边界的地方,罗巴切夫斯 
基几何使你觉得就象位于中间或任何其他地方一样。按照这一欧几里德表象,该模型的 
“边界”正是罗巴切夫斯基几何中的“无穷远”。此处边界圆周根本不应该被看成罗巴 
切夫斯基空间的一部分--在圆周之外的任何其他的欧几里德区域就更不是了。(这一罗 
巴切夫斯基平面的天才表象应归功于彭加莱。它卓越的优点在于,非常小的形状在此表 
象中不被畸变--只不过它的尺度被改变。)该几何中的直线(伊歇鱼就是沿着其中某些 
直线画出的)即为与边界圆周作直角相交的圆弧。 
  
  我们世界在宇宙学的尺度下,实际上很可能是罗巴切夫斯基空间(参阅第七章376页 
)。然而,在这种情形下,三角形亏角和它的面积的比例系数必须是极为微小。在通常 
的尺度下,欧几里德几何是这种几何的极好的近似。事实上正如我们在本章将要看到的 
,爱因斯坦的广义相对论告诉我们,在比宇宙学尺度小相当多的情形下,我们世界的几 
何的确与欧几里德几何有偏离(虽然是以一种比罗巴切夫斯基几何更复杂的“更无规” 
的方式),尽管这偏离在我们直接经验的尺度下仍是极为微小的。 
  
  
  
  欧几里德几何似乎精确地反映了我们世界“空间”的结构的这一事实,作弄了我们 
(以及我们的祖先),使我们以为几何是逻辑所必须的,或以为我们有种先天的直觉的 
领悟,欧几里德几何必须适用于我们在其中生活的世界。(甚至伟大的哲学家伊曼努尔 
·康德也作此断言。)只有爱因斯坦在许多年以后提出的广义相对论真正地突破了欧几 
里德几何,欧几里德几何远非逻辑所必须的,它只是该几何如此精确地(虽然不是完全 
准确地)适合于我们物理空间结构的经验的观测事实!欧几里德几何确实是一个超等的 
物理理论。这是它作为纯粹数学的一部分的精巧性和逻辑性以外的又一个品质。 
  
  在某种意义上,这和柏拉图(约公元前360年;大约在欧几里德著名的《原本》一书 
出版之前五十年左右)采纳的哲学观点相差不远。依柏拉图观点,纯粹几何的对象�& 
#0;直线、圆周、三角形、平面等等--在实际的物理世界中只能近似地得到实现。而那些 
纯粹几何在数学上的精确对象居住在一个不同的世界里--数学观念的柏拉图的理想世界 
中。柏拉图的世界不包括有可感觉的对象,而只包括“数学的东西”。我们不是通过物 
理的方法,而是通过智慧来和这个世界接触。只要人的头脑沉思于数学真理,用数学推 
理和直觉去理解,则就和柏拉图世界有了接触。这个理想世界被认为和我们外部经验的 
物质世界不同,虽然比它更完美,但却是一样地实在。(回顾一下我们在第三章113页和 
第四章129页关于数学概念的柏拉图实在性的讨论。)这样,可以单纯地用思维来研究欧 
几里德几何,并由此推导其许多性质,而外部经验的“不完美的”世界不必要刚好符合 
这些观念。基于当时十分稀少的证据,柏拉图以某种不可思议的洞察力预见到:一方面 
,必须为数学而研究数学,不能要求它完全精确地适用于物理经验的对象;另一方面, 
实际的外部世界的运行只有按照精确的数学--亦即“智慧接触得到的”柏拉图理想世界 
才能最终被理解。 
  
   柏拉图在雅典创建了科学院以推动这种观念。极富影响的著名的哲学家亚里斯多德 
即为其中之出类拔萃者。但是我们要在这里论及另一位比亚里斯多德名望稍低的科学院 
成员,即数学家兼天文学家欧多索斯。依我看来,他是一位更优秀得多的科学家,也是 
古代最伟大的思想家之一。 
  
  欧几里德几何中有一基本的、微妙的并的的确确最重要的部分,那就是实数的引进 
,虽然今天我们几乎不认为它是几何的(数学家宁愿将它称作“分析”的,而非“几何 
”的。)因为欧几里德几何研究长度和角度,所以必须了解用何种“数”来描写长度和 
角度。新观念的核心是在公元前四世纪由欧多索斯(约公元前408至355年)①提出的。 
  
   
几何陷入了“危机”之中(参阅第三章第94页)。将正方形的对角线,以 
  
定律来研究几何量,将几何测量(比)按照整数(比)来表示是很重要的。欧多索斯的 
基本思想是提供一种以整数表达长度比例的办法(也就是实数)。他依赖于整数的运算 
提出了决定一个长度比例是否超过另一个比例,或两者是否完全相等的判据。 
  
  该思想可概述如下:如果a,b,c和d是四个长度,则断定比例a/b大于比例c/d的判 
据是:存在整数M和N,使得a增大到N倍超过b增大到M倍,而同时d增大到M倍超过c增大到 
N倍②。可用相应的判据来断定a/b是否比c/d小。所寻求的使a/b和c/d相等的判据也就是 
前两个判据都不能满足! 
  
  直到十九世纪,狄得钦和韦尔斯特拉斯等数学家才发展出完全精确的抽象的实数数 
学理论。但是他们的步骤和欧多索斯早在22个世纪以前已经发现的思路非常相似!我们 
在此没有必要描述这个现代发展。在第三章第95页我已给出了这个理论的模糊暗示。但 
是,为了更容易表达,我宁愿在这里用更熟悉的小数展开的方法来讨论实数理论。(这 
种展开实际是在 1585年才由斯蒂文引进的。)必须指出,虽然我们很熟悉小数表达方式 
,但希腊人却对此无知。 
  
  
  
  然而,在欧多索斯设想和狄德钦--韦尔斯特拉斯设想之间有一个重大差别。古希腊 
人把实数设想成按照几何量(比)的给定的东西,当作“实际”空间的性质。希腊人用 
算术来描述几何量是为了要严格地处理这些量以及它们的和与积--亦即古人这么许多美 
妙几何定理的要素的先决条件。(我在图5.3画出并解释了杰出的托勒密定理--虽然托勒 
密比欧多索斯要晚许久才发现它--该定理和一个圆周上的四点之间的距离相关,它很清 
楚地表明了和与积都是需要的。)历史证明欧多索斯判据极其富有成果,尤其是它使希 
腊人能严格地计算面积和体积。 
  
  然而,对于十九世纪尤其是当代的数学家而言,几何的作用已被改变了。古希腊人 
,尤其是欧多索斯,认为“实”数是从物理空间的几何中抽取出来的东西。现在我们宁 
愿认为在逻辑上实数比几何更基本。这样的做法还可以允许我们建立所有不同种类的几 
何,每一种几何都是从数的概念出发。(其关键的思想是十六世纪由费马和笛卡尔引进 
的座标几何。座标可用来定义其他种类的几何。)任何这种“几何”必须是逻辑协调的 
,但不必和我们经验的物理空间有任何直接的关联。我们似乎感知的特别物理几何是经 
验的理想化(例如,依赖于我们将其向无限大或无限小尺度的外推,参阅第三章第99页 
)。但是现代的实验已足够精密,以至于我们必须接受“经验的”几何的确和欧几里德 
观念有差别的这一事实(参阅242页)。这种经验和从爱因斯坦广义相对论推导的结果相 
一致。然而,尽管我们的物理世界的几何观点起了变化,欧多索斯二十三世纪之久的实 
数概念在实质上并没有改变。它对爱因斯坦理论正如对欧几里德理论一样重要。其实, 
迄今为止它仍然是一切严肃物理理论的重要部分。 
  
  欧几里德的《原本》的第五部基本上是关于欧多索斯“比例论”的阐述。这对整本 
书而言是极为重要的。全书首版于公元前300年的《原本》的确必须列为有史以来最具深 
远影响的著作之一。它成为后来的几乎所有科学和数学思想的舞台。它全部是由一些被 
认为空间的“自明”性质,亦即清楚叙述的公理出发演绎而来,其中许多重要推论根本 
不是显而易见的,而是令人惊异的。无疑地,欧几里德的著作对后世科学思想的发展具 
有深刻的意义。 
  
  阿基米德(公元前287--212)无疑是古代最伟大的数学家。他天才地利用欧多索斯 
的比例论,计算出诸如球体,或者更复杂地牵涉到抛物线和螺线的许多不同形体的面积 
和体积。今天我们可以用微积分十分容易地做到这些。但是我们要知道,这是比牛顿和 
莱布尼兹最终发现微积分早十九世纪的事!(人们可以说,阿基米德已经通晓微积分的 
那一多半--亦即积分的那一半!)阿基米德的论证,甚至以现代的标准看,也是毫无瑕 
疵的。他的写作深深地影响许多后代的数学家和科学家,最明显的是伽利略和牛顿。阿 
基米德还提出了静力学的(超等的?)物理理论(亦即制约平衡的物体,诸如杠杆和浮 
体的定律)。他用类似于欧几里德发展几何空间和固体几何的科学方法,将其发展成演 
绎的科学。 
  
  阿波罗纽斯(约公元前262--200)是我必须提及的一位阿基米德的同时代人。他是 
一位具有深刻洞察力的、伟大的、天才的几何学家。他关于圆锥截线(椭圆、抛物线和 
双曲线)的研究极大地影响了开普勒和牛顿。令人惊异的是,这些截线的形状刚好是描 
述行星轨道所必须的! 
  
  
  
伽利略---牛顿动力学 
  
  
  
  对运动的理解是十七世纪科学的根本突破。古希腊人对静态的物理--刚性的几何形 
状或处于平衡的物体(此时所有的力都平衡,因而没有运动)理解得很透彻。但是他们 
对制约实际运动的物体的定律并没有很好的概念。他们所缺少的是一个好的动力学理论 
,亦即自然实际上控制物体的位置从第一时刻到下一时刻变化的完美方式的理论。其部 
分原因(绝非全部)则是没有测量时间的足够精密的手段,亦即没有相当好的“钟表” 
。为了给位置变化定时以及确定物体的速度和加速度,人们必须有钟表。因此1583年伽 
利略观察到摆能作为计时的可靠手段的这个事件对他(甚至对整个科学!)极具重要性 
,因为这样一来运动的计时就变准确了4。随着55年后的1638年伽利略《对话》一书的出 
版诞生了新的学科--动力学--开始了从古代神秘主义到现代科学的转化! 
  
  
  
  让我仅仅列举伽利略提出的四个最重要的物理观念。第一是作用在物体上的力决定 
的是它的加速度,而不是速度。此处“加速度”和“速度”的含意是什么呢?粒子--或 
物体上的某点--的速度是该点位置相对于时间的变化率,速度通常是一个矢量,亦即必 
须同时考虑其方向和大小的量(否则我们用“速率”这一术语,见图5.4)。加速度(又 
是一个矢量)是速度相对于时间的变化率--这样加速度实际上是位置相对于时间的变化 
率的变化率!(这对于古人来说实在太难为了!他们既缺乏可胜任的“钟表”,又不具 
备与变化率相关的数学概念。)伽利略断言,作用在物体的力(在他的情形下是指重力 
)制约物体的加速度,而非直接制约其速度--正和古代人例如(亚里斯多德)所相信的 
不一样。 
  
  特别是当不存在外力时,速度必须是常数--因此,在直线上作的恒常运动应是没有 
外力作用的结果(牛顿第一定律)。自由运动着的物体继续其匀速运动,而不必施加外 
力去维持它。伽利略和牛顿发展的动力学定律的一个推论是,直线匀速运动和静止状态 
亦即不运动在物理上完全不可区分:不存在一种局部的方法,将匀速运动从静止中区别 
开来!伽利略关于这点特别清楚(甚至比牛顿还清楚)。他以海上的航船作例子对此作 
了非常形象的描绘(参阅德拉克1953,186至187页): 
  
  
把你和某位朋友关在某艘大船的甲板下的主舱里,和你一道的还有一些苍蝇、蝴蝶和其 
他飞行动物。一些鱼在一大碗水中自由自在地游着;水一滴一滴从悬挂着的瓶子落到下 
面的一个大器皿里。当船静止时,仔细观察这些小动物如何以同样的速率向船舱的所有 
方向飞行。鱼儿不辨方向地游着,水滴落到下面的器皿中;……在仔细地观察了这一切 
以后……让船以你想要的速度行驶。只要其运行是均匀的、并且不让它作这样那样的摇 
动,你就会发现,不但所有提及的现象没有丝毫变化,而且你根本就不知道船是在行驶 
,还是在静止不动……正如早先那样,小水滴落到下面的器皿中去,而不向船尾的方向 
飘去,虽然就在水滴在空气中的时间间隔里,船已经向前走了船身长度好几倍的距离。 
水中的鱼向前游动并不比向后更费动,同样轻松地向放在碗的任何方向的边缘上的鱼饵 
游去。还有,蝴蝶和苍蝇毫无异样地继续飞向四方。似乎它们为了避免落后,在空中随 
着船作长途旅行后感到疲劳,最后聚集到船尾的现象从未发生过! 
  
  
  
  这个被称为伽利略相对论原理的惊人事实,在使哥白尼观点具有动力学意义上十分 
关键。尼古拉·哥白尼(1473--1543)(以及古希腊天文学家亚里斯塔哥斯(约公元前3 
10--230)--不要和亚里斯多德相混淆!��比他早十八世纪)提出了日心说,即太 
阳处于静止状态,而地球在沿自己的轴自转的同时绕着太阳公转,公转速度为每小时十 
万公里。为何我们没有感觉到这种运动?在伽利略提出动力学理论之前,这的确是哥白 
尼观点的深深的困惑。如果更早先的“亚里斯多德式”的动力学观点是正确的话,即在 
空间中运动的系统的实在速度要影响其动力学行为,那么地球的运动对我们就会有直接 
明显的效应。伽利略相对论弄清了,何以地球在运动,而同时我们却不能直接感觉到它 
的原因①。 
  
  值得指出的是,在伽利略相对论中,“静止”的概念并无任何局部上的意义。它对 
人类的空间--时间观念已经具有显著的含义。我们直观的空间--时间图像是,“空间” 
构成了物理事件在其中发生的舞台。物理对象在某一时刻可处于空间的某一点,在后一 
时刻可处于同一个,或另一个不同的空间的点。我们想象空间中的点可以从一个时刻维 
持到另一个时刻。这样,一个物体实际上是否改变其空间位置的说法就具有意义。但是 
,伽利略相对论指出,不存在“静止状态”的绝对意义;所以,“在不同时间的空间的 
同一点”的说法是毫无意义的。某一时刻的物理经验的欧几里德三维空间的哪一点是我 
们的欧几里德三维空间另一时刻的“同一点”呢?没有办法找到。对应于每一时刻我们 
似乎必须有一个完全“新”的欧几里德空间!考虑具有物理实在性的四维空间--时间图 
就会使这一层意思明了(见图5.5)。不同时刻的三维欧几里德空间的确被分开,但所有 
这些空间合并在一起构成了完整的四维的空间--时间图。在空间--时间中进行匀速直线 
运动的粒子的历史是一条直线(称为世界线)。以后在讨论爱因斯坦相对论时我还会回 
到空间��时间以及运动的相对性的问题上来。我们将发现在那种情形下对四维维 
数的论证会更加有力。 
  
  
  
  
  
  伽利略的第三个伟大洞察是开始理解能量守恒。伽利略主要关心物体在重力下的运 
动。他注意到,如果从一静止状态释放一个物体,则不管它是简单地落下,还是随一个 
任意长度的摆振动,或是沿着一个光滑斜面滑下,其速率只依赖于它从释放之处下落的 
垂直距离。正如我们现在所说的,储存于超过地面的高度的能量(引力势能)会转换成 
它的运动的能(只依赖于物体速率的动能)。反之亦然,但总能量既不损失也不增加。 
  
能量守恒定律是一个非常重要的物理原则。它不是物理学的一个独立要求,而是我们很 
快就要讨论的牛顿动力学定律的推论。笛卡尔、惠更斯、莱布尼兹、欧拉以及开尔芬等 
人几个世纪来的努力,使这一定律的表述越发清晰。在本章的后部以及第七章,我们将 
要再回到这个问题上来。如果把能量守恒定律和伽利略的相对论原理相结合,我们就能 
得到更多的相当重要的守恒定律:质量和动量守恒。粒子的动量是它的质量和速度的乘 
积。火箭的推进即是动量守恒的众所周知的例子之一,火箭往前动量的增加恰好和(更 
轻的、但是更急速的)废气往后的动量相平衡。枪的后座力也是动量守恒的一个表现形 
式。牛顿定律的进一步推论是角动量守恒,角动量守恒是描写一个系统的自旋的不变性 
,地球绕自己的轴自旋以及网球的自旋都是依靠它们的角动量守恒来维持的。组成任何 
物体的每一个粒子都对该物体的总角动量有贡献,这贡献等于它的动量与它离开中心的 
垂直距离的乘积。(自旋转物体只要变紧凑,其角速度就会增加,即是其中的一个推论 
。滑冰者和马戏团高架秋千艺术家经常表演的令人惊叹而熟悉的动作也起源于此。他们 
经常利用收回手臂或腿的动作使旋转速度自动增加。)在后面的内容中我们将会看到质 
量、能量、动量以及角动量都是重要的概念。 
  
  最后,我应该让读者回顾一下伽利略的先知的洞察力,那就是当大气摩擦力不存在 
的时候,在重力作用下所有物体都以同一速率下落。(读者也许会回想起他从比萨斜塔 
上同时释放不同物体的著名故事,)三个世纪以后,正是这一个洞察导致爱因斯坦将其 
相对论原理推广到加速参考系统,从而为他的非凡的引力的广义相对论提供了基石,这 
在本章的结尾处将会看到。 
  
  
  
   
  
  在伽利略的创立的令人印象深刻的基础上,牛顿建立了绝顶庄严华美的大教堂。牛 
顿指出了物体行为的定律。第一和第二定律基本上是伽利略给出的:如果没有外力作用 
到一个物体上,则物体将继续其直线匀速运动;如果有外力作用到上面,则物体的质量 
乘以它的加速度(亦即其动量变化率)等于这个力。牛顿本人的一个特殊的洞察,在于 
意识到还需要第三定律:物体A作用在物体B上的力,刚好和物体B作用到物体A上的力大 
小一样而方向相反(“每一个作用必有其大小一样方向相向的反作用”)。这就提供了 
基本的框架。“牛顿宇宙”是由在服从欧几里德几何定律的空间中运动的粒子所组成。 
作用到这些粒子上的力决定了他们的加速度。每一个粒子所受的力是由所有其他粒子分 
别贡献到该粒子的力利用矢量加法定律相加而得到(见图5.6)。为了很好地定义这个系 
统需要一些规则,这些规则可以告诉我们从另一个粒子B作用到粒子A的力是什么样子的 
。通常我们需要该力沿着AB之间的连线作用(见图5.7)。如果该力是引力,则A和B之间 
的力是互相吸引的,其强度和它们质量乘积成正比,而和它们之间的距离的平方成反比 
:亦即反平方律。对于其他种类的力,其依赖于位置的方式可与此不同,也可能决定于 
粒子质量以外的其他性质。 
  
  伽利略的一位同时代人,伟大的约翰斯·开普勒(1571--1630)注意到,行星绕太 
阳公转的轨道是椭圆而不是圆周(太阳总是处于该椭圆的一个焦点上,而不在其中心) 
。他还给出了制约行星作此椭圆运动的速率的其他两个定律。牛顿能够从他自己的一般 
理论(以及引力的反平方律)推导出开普勒三定律。不仅如此,他还对开普勒的椭圆轨 
道作了各种细节上的修正,诸如春秋分日点的进动(许多世纪以前的希腊人已注意到这 
些地球旋转轴方向的这种极慢的运动)。为了取得所有这些成就,牛顿就必须发展除了 
微积分之外的许多数学手段。他惊人的成就得大大归功于其超等的数学技巧及其同等超 
人的物理洞察力。 
  
  
  
牛顿动力学的机械论世界 
  
  
  
  如果已知特定的力的定律(例如引力的反平方律),则牛顿理论就表达成一组精密 
的确定的动力学方程。如果各个粒子在某一个时刻的位置、速度和质量是给定的,则它 
们随后任何时间的位置、速度(以及质量--这被当作常数)就被数学地确定,这种牛顿 
力学的世界所满足的决定论形式对哲学思维产生了(并正在产生着)深远的影响。让我 
们更仔细地考察牛顿的决定论。它对“自由意志”有何含义呢?一个严格的牛顿世界能 
包含精神吗?甚至牛顿世界能包含计算机器吗? 
  
  让我们先明确一下什么是世界的“牛顿”模型。例如,我们可以认为组成物体的所 
有粒子是数学的、亦即没有尺度的点。另外的办法是将它们当作球状的刚性球。无论如 
何,我们都必须假定知道力的定律,例如,牛顿引力论中的引力的反平方律。我们还要 
对自然的其他力,比如电力和磁力(威廉·吉尔伯特在1600年首先仔细研究过)以及现 
代已知将粒子(质子和中子)绑在一起形成原子核的强核力的定律也表述出来。电力正 
和引力一样满足反平方律,但类似的粒子互相排斥(而不像引力那样互相吸引)。这里 
不是粒子的质量,而是它们的电荷决定它们之间电力的强度。磁力和电力一样也是“反 
平方的”①,但是核力以相当不同的形式随距离而变化。在原子核中当粒子相互靠得紧 
密时核力极大,而在更大距离下则可以忽略不计。 
  
  假定我们采用刚体圆球的模型,并要求两个球碰撞时,它们即完全弹性地反弹。也 
就是说,它们如同两个完好的撞球那样,在能量(或总动量)没有损失的情况下分离开 
。我们还必须明确指明两球之间的作用力。为了简单起见,我们可以假定任两球之间的 
作用力都沿着它们中心的连线,其大小为该连线长度的给定的函数。(由于牛顿的一个 
出色的定理,此假设对牛顿引力自动成立。对其他力的定律,这可当成一个协调的要求 
而加上的条件。)如果刚体只进行成对碰撞,而不发生三个或更多个的碰撞,则一切都 
定义得很好,而且结果会连续地依赖于初始条件(亦即只要初态的变动足够小,财能保 
证结果变化也很小)。斜飞碰撞的行为是两球刚好相互错过的行为的连续过渡。但在三 
球或多球碰撞的情形下就产生了新问题。例如,如果三球ABC一下子跑到一块,那AB先碰 
撞,紧接着C和B碰撞,或AC先碰撞,紧接着B和A碰撞,情况就很不一样(见图5.8)。在 
我们的模型中,只要有三碰撞发生就存在非决定性!只要我们愿意,就可以用“极不可 
能”的理由简单地将三碰撞或多碰撞的情形排除掉。这就提供了一种相当一致的方案, 
但三碰撞的潜在问题表明终态将以不连续的方式依赖于初态。 
  
  
  
  
  
  这有点使人不满意,我们也许会更喜欢点粒子的图像。但是,为了避免某些点粒子 
模型引起的理论困难(当两个粒子撞到一起时出现的无限大力和无限大能量),人们必 
须做其他假设,诸如在短距离时粒子的相互作用力变成非常强的排斥力等等。在这种情 
形下,我们可以保证任何一对粒子实际上都不会碰撞到一起。(这也使我们避免了它们 
碰撞时的点粒子如何行为的问题!)然而,为了直观起见,我宁愿完全按照刚球模型来 
讨论。看来这种“撞球”图像正是大多数人下意识的实体的模型。 
  
  牛顿5撞球的实体模型(不管多碰撞问题)确实是一个决定论模型。此处“决定论” 
的含义是:所有球(为了避免某些麻烦,假定为有限个)在将来(或过去)的物理行为 
数学地被某一时刻的位置和速度所完全决定。这样看来,在这个撞球的世界上根本没有 
余地让“精神”用“自由意志”的行动去影响物体的行为。我们如果还信仰“自由意志 
”的话,就要被迫对实际世界的如此构成方式提出质疑。 
  
  这个令人烦恼的“自由意志”问题一直徘徊在这整部书的背景里--虽然在多数情况 
下,我必须说只在背景里。在本章后头有一个很小却很奇特的地方牵涉到它(关于相对 
论中超光速讯号传递的问题)。我将在第十章直接着手自由意志的问题。读者一定会对 
我的结果深感失望。我的确相信,这里存在一个真正的、而非想象的问题。但它是非常 
根本的,并且要把它表述清晰非常困难。物理理论中的决定论是一个非常重要的问题, 
但是我相信这只是问题的一部分。例如,这个世界很可能是决定性的,但同时却是不可 
计算的。这样,未来也许以一种在原则上不能计算的方式被现在所决定。我将在第十章 
论证,我们具有意识的头脑的行为的确是非算法的(亦即不可计算的)。相应地,我们 
自信所具备的自由意志就必然和制约我们在其中生活的世界的定律中某些不可计算部分 
紧密地纠缠在一起。是否接受这样的关于自由意志的观点,亦即给定的物理(例如牛顿 
)理论,是否的确是可计算的,而不仅仅是否是决定性的,是一个有趣的问题。可计算 
性不同于决定性--这正是我试图在本书所要强调的。 
  
  
  
撞球世界中的生活是可计算的吗? 
  
  
  
  我现在使用一个决定性的、但不可计算的“玩具宇宙模型”,来解释可计算性和决 
定性是不同的。我承认这是一个人为的特别例子。宇宙任何“时刻”的“态”可用一对 
自然数(m,n)来表示。用Tu表示一台固定的普适图灵机,譬如在第二章(63页)定义 
的那一台。为了决定下一“时刻”宇宙的态,我们必须知道Tu在m上的作用最终停止不或 
不停(亦即用第二章65页的记号,Tu(m)≠□还是Tu(m)=□成立)。如果它停止,则 
下一时刻的态为(m+1,n)。如果它不停止,则为(n+1,m)。从第二章我们知道,不 
存在图灵机停止问题的算法。这样就不存在去预言这个模型宇宙“将来”的算法,尽管 
它是完全决定性的6! 
  
  当然,这不能认为是一个严肃的模型。但它表明存在一个要回答的问题。我们可对 
任何决定性的物理理论考察其可计算性。那么,牛顿的撞球世界究竟是否可计算的呢? 
  
  物理可计算性的问题部分地依赖于我们打算对此系统问哪一种问题。在牛顿撞球模 
型中,我能想到一些可以问的问题,我对这些问题的猜测是,要弄清其答案不是一个可 
计算(亦即算法的)事体。球A和球B究竟会碰撞否便是这样的一个问题。其思路是,在 
某一特定时刻(t=O)所有球的位置和速度作为初始数据给定后,我们要知道,A和B是否 
会在将来的任一时刻(t>O)碰撞?为使这个问题更明确(虽然不是特别现实),我们 
可以假定,所有球的半径和质量都一样,并且每一对球之间的作用力是反平方律的。我 
之所以猜想这是非算法可解的问题的一个原因是,该模型有点像爱德华·弗列得钦和托 
马索·托弗里在1982年提出的“计算的撞球模型”。在他们的模型中,球被若干堵“墙 
”所限制(而不是反平方律的力);但是它们互相以类似于我刚描述过的牛顿球那样弹 
性反弹(见图5.9)。在弗列得钦--托弗里模型中,所有电脑的基本逻辑运算都可由球来 
实现。我们可以模拟图灵机的任何计算:对图灵机Tu的特别选取规定了弗列得钦�� 
;托弗里机器的“墙”等等的搭配;运动的球的初态可认为是输入磁带的信息的码,将球 
的终态解码就得到图灵机输出磁带的信息。这样一来,人们会特别关心这样一个问题: 
如此这般的图灵机会有停止之时吗?“停止”的是意味着球A最终和球B碰撞。我们已知 
这个问题不能用算法回答(71页),这事实至少暗示我前面提出的“球A最终和球B碰撞 
吗?”的牛顿问题也不能用算法回答。 
  
  事实上,牛顿问题比弗列得钦和托弗里提出的问题要棘手得多,后者可依照分立变 
数(亦即按照诸如“球或者在通道上或者不在”的“在或不在”的陈述)来指明其状态 
。但在完整的牛顿问题中必须以无限的精度,按照实数的座标而不是以分立的方式指明 
球的初始位置和速度。这样,我们又面临着在第四章处理关于孟德勒伯洛特集是否可递 
归的问题时所必须考虑的所有麻烦。当允许输入和输出数据为连续变化的变数时“可计 
算性”的含义是什么呢7?我们可以暂时假定所有初始位置和速度座标均为有理数(虽然 
不能预料在t的时刻以后的有理数仍保持为有理数),而使此问题变得稍为缓和。我们知 
道有理数为两整数的比,所以为一可列集。我们可用有理数来任意地逼近所选择用来考 
察的任何初始数据了。对于有理数的初始数据,也许不存在决定A和B是否最终会碰撞的 
算法的猜测决不是毫无道理的。 
  
  
  
  然而,这并不是诸如“牛顿撞球世界是不可计算的”断言的真正含义。我用来和我 
们的牛顿撞球世界作比较的弗列得钦--托弗里“撞球电脑”的特殊模型的确按照计算而 
进行。无论如何,这是弗列得钦和托弗里思想的基本点--他们模型的行为应该和一台( 
普适)电脑一样!我试图要提的问题是,在某种意义上,人类大脑驾驭适当的“不可计 
算的”物理定律,能比图灵机做得更好,这一点是不是可以理喻的。追究如下的问题将 
是徒劳的: 
  
  “如果球A永远碰不到球B,则你的问题的答案为‘非’。” 
  
  人们可能永远也等待不到断定问题中的球不会碰到一起的时刻!那当然正是图灵机 
行为的方式。 
  
  事实似乎很清楚地表明,牛顿撞球世界在某个合适的意义上(至少在如果我们不管 
多碰撞的问题之时)是可计算的。人们通常计算这种行为的方法是做一些近似。我们可 
以想象这些球的中心被指定在点的网格上,譬如讲网格的点被划分到百分之几单位。时 
间也被认为是“分立”的,所有可允许的时刻是某一小单位(用△t表示)的倍数。这就 
产生了一定的“速度”的可允许的分立值(两个连续允许的格点的位置的座标值的差, 
除以△t)。利用力的定律来计算加速度的适当的近似,再利用它使“速度”并因此下一 
允许时刻的新的格点位置被确定到所需要的近似程度。只要我们能维持所需的精度,则 
这种计算就可一直进行下去。很有可能算不了多少次其精度就失去了。以后的步骤是从 
更细的空间分格,以及更细的时间间隔重新开始。这一回能得到更好的精度,并在精度 
损失之前能计算到更久的将来的某一时刻。不断地增加细度,则计算的精度和所到达的 
将来的时间的长度就能不断地改进。可用这种方法将牛顿撞球世界计算到任意高的精度 
(不管多碰撞的问题)--我们可以在这种意义上讲牛顿世界的确是可计算的。 
  
  然而,认为这一个世界在实际上是“不可计算的”断言是具有某种含义的。这是因 
为得知的初始数据的精度总是受限制的。这类问题的确存在着固有的不可忽视的“不稳 
定性”。初始数据的极为微小的改变会导致结果行为的绝大的变化。(任何玩撞球的人 
,在他想用一个球去撞另一个使之落入球囊时,都知道我这样说的意思!)这在(连续 
)碰撞发生时尤其明显。但是,这种不稳定性行为也会发生在牛顿的引力远距离作用时 
(多于两体的情况下)。所谓的“混沌”或“混沌行为”经常用来表示这种不稳定的类 
型。例如,混沌行为对天气影响重大。虽然我们对控制基本元素的牛顿方程式了解甚多 
,但是远期天气预报之不可靠性则是臭名昭彰的! 
  
  这根本不是那类可以任何方式驾驭的“不可计算性”。这只是因为所知的初始态的 
精度有限,而终态不能由初态可靠地算出。实际上只是随机因素被引入到未来的行为中 
而已。如果大脑的确使用了物理定律中的不可计算性的有用的因素,则它们必须具有完 
全不同的、并从这里引出更正面得多的特性。相应地,我根本不把这种“混沌”行为称 
为“不可计算性”,而将其称为“不可预见性”。正如我们很快就会看到的,在(经典 
)物理学中的决定性的定律中存在不可预见性,是一种非常一般的现象。在制造思维机 
器时,不可预见性正是我们希望尽量减小而不是去“驾驭”的东西! 
  
  为了更一般地讨论可计算性和不可预见性的问题,对物理定律采用比以前更广泛的 
观点将会更有助。这就促使我们不仅只考虑牛顿力学的理论,而且研究随后超越过它的 
各种理论。我们需要领略力学的美妙的哈密顿形式。 
  
哈密顿力学 
  
  
  
牛顿力学不仅在于非凡地应用到物理世界方面,而且在于它所引起的数学理论的丰富方 
面取得瞩目的成功。令人惊异的是,自然界所有超等理论都被证明是数学观念的丰富来 
源。这些绝顶精确的理论就作为数学而言也是极富成果的,这个事实具有一种深刻和美 
丽的神秘。它毫无疑问地表明,在我们经验的实在世界和柏拉图的数学世界之间有某种 
根本的关联。(我将在第十章495页再讨论这一些。)牛顿力学也许是这方面的一个顶峰 
,因为它一诞生即获得了微积分。而且,牛顿理论形成了非凡的称为经典力学的数学观 
念的实体。十八和十九世纪许多伟大数学家的名字都和此发展相关联:欧拉、拉格朗日 
、拉普拉斯、刘维尔、泊阿松、雅科比、奥斯特洛夫斯基、哈密顿。被称为“哈密顿理 
论”8的即为这一工作的总结。为了我们的目的对其稍微了解即可以了。威廉姆·罗曼· 
哈密顿(1805--1865)是一位多才多艺和富有创见的爱尔兰数学家,他还是在165页讨论 
过的哈密顿线路的发明者。他把力学发展成强调其与波传播相类似的形式。波和粒子的 
关系的暗示,以及哈密顿方程的形式对于后来的量子力学的发展极为重要。我在下一章 
还会提及。 
  
  用以描述物理系统的“变量”是哈密顿理论的一个奇妙的部分。迄今为止,我们一 
直把粒子的位置当作基本的,而速度作为位置对时间的变化率。我们记得在牛顿系统中 
为了确定随后的行为,必须指定初始态(192页),也就是需要所有粒子的位置和速度。 
在哈密顿形式中,我们必须挑选粒子的动量,而不是速度。(我们在190页提到粒子动量 
是速度和质量的乘积。)这种改变似乎很微不足道,但是重要的在于每一粒子的位置和 
动量似乎被当作独立的量来处理。这样,人们首先“假装”不同粒子的动量和它所对应 
的位置的改变率没有什么关系,而仅仅是一组分开的变量。我们可以想像它们“可以” 
完全独立于位置的运动。现在在哈密顿形式中我们有两族方程。有一族告诉我们不同粒 
子的动量如何随时间变化,另一族告诉我们位置如何随时间变化。在每一种情况下,变 
化率总是由在该时刻的不同位置和动量所决定。 
  
  粗略地讲,第一族哈密顿方程表述了牛顿的关键的第二运动定律(动量变化率=力) 
,而第二族方程告诉我们动量实际上即是依赖于速度(位置变化率=动量÷质量)。我们 
记得,伽利略--牛顿的运动定律是用加速度,即位置变化率之变化率(亦即“二阶”方 
程)来描述。现在,我们只需要讲到事物的变化率(“一阶”方程),而不是事物变化 
率的变化率。所有这些方程都是从一个重要的量推导而来:哈密顿函数H,它是系统的总 
能量按照所有位置和动量变量的表达式。 
  
  哈密顿形式提供了一种非常优雅而对称的力学描述,我们在下面写出这些方程,仅 
仅是为了看看它们是什么样子的。虽然,甚至许多读者并不熟悉完全理解之所必须的微 
积分记号--它在这里是不需要的。就微积分而言,所有我们真正要理解的是,出现在每 
一个方程左边的点表示(在第一种情况下,动量的;在第二种情况下,位置的)对时间 
的变化率: 
  
  
  
  这里下标i用以区别所有不同的动量座标p1,p2,p3,p4,…和所有不同的位置座标 
x1,x2,x3,x4,…。n个不受限制的粒子具有3n个动量座标和3n个位置座标(每一个代 
表空间中的三个独立的方向)。符号表示“偏微分”(“在保持其他变量为常数的情况 
下取导数”)。正如前述的,H为哈密顿函数。(如果你不通晓“微分”,不必担心。只 
要认为这些方程的右边是某些定义完好的,以xi和pi来表达的数学式子就行了。) 
  
  在实际上,座标x1,x2,…和p1,p2,…可允许为某种比粒子通常的笛卡尔座标( 
亦即xi为通常的沿三个不同的相互垂直的方向测量的距离)更一般的东西。例如座标xi 
中的一些可以是角度(在这种情形下,相应的pi就是角动量,而不是动量,参见190页) 
,或其他某些完全一般的测度。令人惊异的是,哈密顿方程的形状仍然完全一样。事实 
上,合适地选取H,哈密顿形式不仅仅是对于牛顿方程,而且对任何经典方程的系统仍然 
成立。对于我们很快就要讨论的马克斯韦(--洛伦兹)理论,这一点尤其成立。哈密顿 
方程在狭义相对论中也成立。如果仔细一些,则广义相对论甚至也可并入到哈密顿框架 
中来。此外,我们将要看到在薛定谔方程(332页)中,哈密顿框架为量子力学提供了出 
发点。尽管一世纪以来  
  构的形式却是如此地统一,这真是令人惊叹! 
  
  
  
相空间 
  
  
  
  哈密顿方程的形式允许我们以一种非常强而有力的一般方式去“摹想”经典系统的 
演化。想象一个多维“空间”,每一维对应于一个座标x1,x2,…p1,p2,…(数学空间 
的维数,通常比3大得多。)此空间称之为相空间(见图5.10)。对于n个无约束的粒子 
。相空间就有6n维(每个粒子有三个位置座标和三个动量座标)。读者或许会担心,甚 
至只要有一个单独粒子,其维数就是他或她通常所能摹想的二倍!不必为此沮丧!尽管 
六维的确是比能明了画出的更多的维数,但是即使我们真的把它画出也无太多用处。仅 
仅就一满屋子的气体,其相空间的维数大约就有 
  
  10 000 000 000 000000000000 000 000 
  
  去准确地摹想这么大的空间是没有什么希望的!既然这样,秘诀是甚至对于一个粒 
子的相空间都不企图去这样做。只要想想某种含糊的三维(或者甚至就只有二维)的区 
域,再看看图5.10就可以了。 
  
  
  
  我们如何按照相空间来摹想哈密顿方程呢?首先,我们要记住相空间的单独的点Q实 
际代表什么。它代表所有位置座标x1,x2,…和所有动量座标p1,p2,…的一种特别的 
值。也就是说,Q表示我们整个物理系统,指明组成它的所有单独粒子的特定的运动状态 
。当我们知道它们现在的值时,哈密顿方程告诉我们所有这些座标的变化率是多少;亦 
即它控制所有单独的粒子如何移动。翻译成相空间语言,该方程告诉我们,如果给定单 
独的点Q在相空间的现在位置的话,它将会如何移动。为了描述我们整个系统随时间的变 
化,我们在相空间的每一点都有一个小箭头��更准确地讲,一个矢量��它 
告诉我们Q移动的方式。这整体箭头的排列构成了所谓的矢量场(图5.11)。哈密顿方程 
就这样地在相空间中定义了一个矢量场。 
  
  我们看看如何按照相空间来解释物理的决定论。对于时间t=0的初始数据,我们有了 
一族指明所有位置和动量座标的特定值;也就是说,我们在相空间特别选定了一点Q。为 
了找出此系统随时间的变化,我们就跟着箭头走好了,这样,不管一个系统如何复杂, 
该系统随时间的整个演化在相空间中仅仅被描述成一点沿着它所遭遇到的特定的箭头移 
动。我们可以认为箭头为点Q在相空间的“速度”。“长”的箭头表明Q移动得快,而“ 
短”的箭头表明Q的运动停滞。只要看看Q以这种方式随着箭头在时间t移动到何处,即能 
知道我们物理系统在该时刻的状态。很清楚,这是一个决定性的过程。Q移动的方式由哈 
密顿矢量场所完全决定。 
  
  
  
  关于可计算性又如何呢?如果我们从相空间中的一个可计算的点(亦即从一个其位 
置和动量座标都为可计算数的点,参阅第三章95页)出发,并且等待可计算的时间t,那 
么一定会终结于从t和初始数据计算得出的某一点吗?答案肯定是依赖于哈密顿函数H的 
选择。实际上,在H中会出现一些物理常数,诸如牛顿的引力常数或光速--这些量的准确 
值视单位的选定而被决定,但其他的量可以是纯粹数字--并且,如果人们希望得到肯定 
答案的话,则必须保证这些常数是可计算的数。如果假定是这种情形,那我的猜想是, 
答案会是肯定的。这仅仅是一个猜测。然而,这是一个有趣的问题,我希望以后能进一 
步考察之。 
  
  另一方面,由于类似于我在讨论有关撞球世界时简要提出的理由,对我来说,这似 
乎不完全是相关的问题。为了使一个相空间的点是不可计算的断言有意义,它要求无限 
精确的座标��亦即它的所有小数位!(一个由有限小数描述的数总是可以计算的 
。)一个数的小数展开的有限段不能告诉我们任何关于这个数整个展开的可计算性。但 
是,所有物理测量的精度都是有限的,只能给出有限位小数点的信息。在进行物理测量 
时,这是否使“可计算数”的整个概念化成泡影?” 
  
  的确,一个以任何有用的方式利用某些物理定律中(假想的)不可计算因素的仪器 
不应依赖于无限精确的测量。也许我在这里有些过分苛刻了。假定我们有一台物理仪器 
,为了已知的理论原因,模拟某种有趣的非算法的数学过程。如果此仪器的行为总可以 
被精密地确定的话,则它的行为就会给一系列数学上有趣的没有算法的(像在第四章中 
考虑过的那些)是非问题以正确答案。任何给定的算法都会到某个阶段失效。而在那个 
阶段,该仪器会告诉我们某些新的东西。该仪器也许的确能把某些物理常数测量到越来 
越高的精度。而为了研究一系列越来越深入的问题,这是需要的。然而,在该仪器的有 
限的精度阶段,至少直到我们对这系列问题找到一个改善的算法之前,我们得到某些新 
的东西。然而,为了得到某些使用改善了的算法也不能告诉我们的东西,就必须乞求更 
高的精度。 
  
  尽管如此,不断提高物理常数的精度看来仍是一个棘手和不尽人意的信息编码的方 
法。以一种分立(或“数字”)形式得到信息则好得多。如果考察越来越多的分立单元 
,也可重复考察分立单元的固定集合,使得所需的无限的信息散开在越来越长的时间间 
隔里,因此能够回答越来越深入的问题。(我们可以将这些分立单元想象成由许多部分 
组成,每一部分有“开”和“关”两种状态,正如在第二章描述的图灵机的0和1状态一 
样。)为此看来我们需要某种仪器,它能够(可区别地)接纳分立态,并在系统按照动 
力学定律演化后,又能再次接纳一个分立态集合中的一个态。如果事情是这样的话,则 
我们可以不必在任意高的精度上考察每一台仪器。 
  
  那么,哈密顿系统的行为确实如此吗?某种行为的稳定性是必须的,这样才能清晰 
地确定我们的仪器实际上处于何种分立态。一旦它处于某状态,我们就要它停在那里( 
至少一段相当长的时间),并且不能从此状态滑到另一状态。不但如此,如果该系统不 
是很准确地到达这些状态,我们不要让这种不准确性累积起来;我们十分需要这种不准 
确性随时间越变越小。我们现在设想的仪器必须由粒子(或其他子元件)所构成。需要 
以连续参数来描述粒子,而每一个可区别的“分立”态复盖连续参数的某个范围。(例 
如,让粒子停留在二个盒子中的一个便是一种表达分立双态的方法。为了指明该粒子确 
实是在某一个盒子中,我们必须断定其位置座标在某个范围之内。)用相空间的语言讲 
,这表明我们的每一个“分立”的态必须对应于相空间的一个“区域”,同一区域的相 
空间点就对应于我们仪器的这些可选择的同一态(图5.12)。 
  
  
  
  
  
  现在假定仪器在开始时的态对应于它的相空间中的某一个范围R0。我们想象R0随着 
时间沿着哈密顿矢量场被拖动,到时刻t该区域变成Rt。在画图时,我们同时想象对应于 
同一选择的所有可能的态的时间演化(见图5.13)。关于稳定性的问题(在我们感兴趣 
的意义上讲)是,当t增加时区域Rt是否仍然是定域性的,或者它是否会向相空间散开去 
。如果这样的区域在时间推进时仍是定域性的,我们对此系统就有了稳定性的量度。在 
相空间中相互靠近的点(这样它们对应于相互类似的系统的细致的物理态)将继续靠得 
很近,给定的态的不准确性不随时间而放大。任何不正常的弥散都会导致系统行为的等 
效的非预测性。 
  
  我们对于哈密顿系统可以一般地说什么呢?相空间的区域究竟是否随时间散开呢? 
似乎对于一个如此广泛的问题,很少有什么可说的。然而,人们发现了一个非常漂亮的 
定理,它要归功于杰出的法国数学家约瑟夫·刘维尔(1809--1882)。该定律讲,相空 
间中的任何区域的体积在任何哈密顿演化下必须保持常数。(当然,由于我们的相空间 
是高维的,所以“体积”必须是在相应高维意义上来说的。)这样,每一个R1的体积必 
须和原先的R0的体积一样。初看起来,这给了我们的稳定性问题以肯定的答案。在相空 
间体积的这层意义上,我们区域的尺度不能变大,好像我们的区域在相空间中不会散开 
似的。 
  
  然而,这是使人误解的。我们在深思熟虑之后就会感到,很可能情况刚好与此相反 
!在图5.14中我想表示人们一般预料到的那种行为。我们可以将初始区域R0想象成一个 
小的、“合理的”,亦即较圆的而不是细长的形状。这表明属于R0的态在某种方面不必 
赋予不合情理的精确性。然而,随着时间的发展,区域R1开始变形并拉长--初看起来有 
点像变形虫,然后伸长到相空间中很远的地方,并以非常复杂的方式纠缠得乱七八糟。 
体积的确是保持不变,但这个同样小的体积会变得非常细,再发散到相空间的巨大区域 
中去。这和将一小滴墨水放到一大盆水中的情形有点类似。虽然墨水物质的实际体积不 
变,它最终被稀释到整个容器的容积中去。区域Rt在相空间中的行为与此很类似。它可 
能不在全部相空间中散开(那是称之为“爱哥狄克”的极端情况),但很可能散开到比 
原先大得极多的区域去。(可参阅戴维斯(1974)的进一步讨论。) 
  
  麻烦在于保持体积并不意味就保持形状:小区域会被变形,这种变形在大距离下被 
放大。由于在高维时存在区域可以散开去的多得多的“方向”,所以这问题比在低维下 
严重得多。事实上,刘维尔定理远非“帮助”我们将区域Rt控制住,而是向我们提出了 
一个基本问题!若无刘维尔定理,我们可以摹想相空间中区域的毫无疑义的发散趋势可 
由整个空间的缩小而补偿。然而,这一个定律告诉我们这是不可能的,而我们必须面对 
这个惊人的含义--这个所有正常类型的经典动力学(哈密顿)系统的普适的特征9! 
  
  鉴于这种发散到整个相空间去的行为,我们会问,经典力学怎么可能作出预言?这 
的确是一个好问题。这种弥散所告诉我们的是,不管我们多么精确地(在某一合理的极 
限内)知道系统的初始态,其不确定性将随着时间而不断增大,而我们原始的信息几乎 
会变得毫无用处。在这个意义上讲,经典力学基本上是不可预言的。(回想前面考虑过 
的“混沌”概念) 
  
  
  
  
  
  那么,何以迄止为止牛顿动力学显得如此之成功呢?在天体力学中(亦即在引力作 
用下的天体)其原因在于,第一,有关的凝聚的物体数目相对很少(太阳、行星和月亮 
),这些物体的质量相差悬殊��这样在估量近似值时,可以不必管质量更小物体 
的微扰效应,而处理更大的物体时,仅仅需要考虑它们相互作用的影响--第二,可以看 
到,适用于构成这些物体的个别粒子的动力学定律,也可以在这些物体本身上的水平上 
适用--这使得在非常好的近似下,太阳、行星和月亮实际上可以当作粒子来处理,我们 
不必去为构成天体的单独粒子的运动的微小细节去担忧10。我们再次只要考虑“很少” 
的物体,其在相空间中的弥散不重要。 
  
  除了天体力学和投掷物行为(它其实是天体力学的一个特例)之外,只牵涉到小数 
目的粒子的简单系统的研究,牛顿力学所用的主要方法是根本不管这些细节的“可决定 
性地预言的”方面。相反地,人们利用一般的牛顿理论做模型,从这些模型可以推导出 
整体行为。某些诸如能量、动量和角动量守恒定律的准确推论的确在任何尺度下都有效 
。此外,存在可与制约单独粒子的动力学规律相结合的统计性质,它能对有关的行为作 
总体预言。(参阅第七章关于热力学的讨论;我们刚讨论过的相空间弥散效应和热力学 
第二定律有紧密的关系。我们只要相当仔细,便可利用这些观念作预言。)牛顿本人所 
做的空气声速的计算(1个世纪后拉普拉斯进行了微小的修正)便是一个好例子。然而, 
牛顿(或更笼统来说,哈密顿)动力学中固有的决定性在实际上适用的机会非常稀少。 
  
  相空间弥散效应还有一个惊人的含义。它告诉我们,经典力学不能真正地描述我们 
的世界!我说得有点过分了一些,但是并不太过份。经典力学可以很好地适用于流体-- 
特别是气体的行为,在很大的程度上适用于液体--此处人们只关心粒子系统的“平均” 
性质,但是在对固体作计算时就出了毛病,这里要求知道更细节的组织结构。固体由亿 
万颗点状的粒子所组成,由于相空间弥散其排列的有序性应不断地降低,何以保持其形 
状大致不变呢?正如我们已经知道的,量子力学在理解固体的实在结构时是不可或缺的 
。量子效应可多多少少防止相空间的弥散(见第八章和第九章)。 
  
  这也和制造“计算机器”的问题相关。相空间弥散是某种必须控制的东西。相空间 
中对应于一个电脑的“分立”态的区域(例如前述的R0)不应允许其过度弥散开来。我 
们记得,甚至弗列得钦--托弗里“撞球电脑”需要某种外围的固体墙才能工作。包括许 
多粒子的物体的“刚性”正是需要量子力学起作用的某种东西。看来,甚至“经典”电 
脑也必须借助于量子物理学的效应才能有效地工作! 
  
  
  
马克斯韦电磁理论 
  
  
  
  在牛顿的世界图像中,人们设想一个微小粒子靠一种超距作用的力作用到另一个粒 
子上。如果粒子不是完全点状的。可以认为由于偶尔的实际物理接触而互相反弹离开。 
正如我前面(193页)提到的,电学和磁学(古人即知道此两者的存在,威廉·吉尔伯特 
在1600年和本查明·佛兰克林在1752年分别进行了一些细节的研究)的行为和引力很类 
似。虽然同号的电荷(磁极强度)相互排斥而不是吸引,它们都以距离的反平方律衰减 
。这里的电磁力是由电荷(磁极强度),而不是由质量决定其强度。在这个水平上,将 
电学和磁学归并到牛顿理论中去并没有什么困难。光的行为也可以粗略地(虽然有某些 
困难)容纳进去。我们或者将光当作单独粒子(正如我们现在应称之为“光子”的那样 
)组成,或者把它当作某种媒质中的波的运动。在后一情况该媒质(“以太”)本身应 
认为是由粒子组成的。 
  
  运动电荷会产生磁力的这一事实引起了额外的复杂性,但是这并没有把整个体系瓦 
解。大量的数学家和物理学家(包括高斯)提出了在一般牛顿框架中似乎满意的、描述 
运动电荷效应的方程组。第一位向这个“牛顿式”的图像提出严肃挑战的科学家是英国 
伟大的实验家兼理论家米凯尔·法拉第(1791--1867)。 
  
  为了理解这个挑战的性质,我们首先要定义物理场的概念。首先考虑磁场。大部分 
读者都有过这样的经验,将一张纸放在磁铁上时,纸上的铁粉末具有特别的形态。这些 
粉末以一种令人惊异的方式沿着所谓的“磁力线”串起来。我们可以想象,即便粉末不 
在该处,磁力线仍在那里。它们构成了我们称之为磁场的东西。这“场”在空间的每一 
点都朝着一定的方向,亦即在该点力线的方向。实际上,我们在每一点都有一个矢量。 
这样,磁场就给我们提供了一个矢量场的例子。(我们可把它和上一节考虑的哈密顿矢 
量场相比较,但现在这一个矢量场是在通常的空间中,而不在相空间中。)类似地,一 
个带电的物体被一种称之为电场的不同种类的场所围绕;而且引力场也类似地围绕着任 
何有质量的物体。这些也都是空间的矢量场。 
  
  远在法拉第之前,人们就有了这些观念,它们已成为牛顿力学理论家的一部份武器 
。但是认为这种“场”中不包含实际物理物质的观点占优势。反之,它们被当作为某一 
个粒子放在不同的点时所作用的力提供一种必要的“薄记”。然而,法拉第深刻的实验 
发现(利用运动线圈、磁铁等等)使他坚信,电磁场是真正的“东西”,并且变化的电 
磁场有时会相互“排挤”到原先空虚的空间,以产生一种脱离物体的波动!他猜测到光 
也许就包括这类波动。这种观点背离了占统治地位的“牛顿智慧”。按照牛顿的观点, 
这类场不能在任何意义上被认为是“真实的”,而仅仅是作为“真正的”牛顿点粒子超 
距作用“实在”图像的方便的数学辅助物而已。 
  
  面临着法拉第以及优秀的法国物理学家安德列·玛雷·安培(1775--1836)和其他人 
更早的实验发现,伟大的苏格兰物理学家兼数学家詹姆斯·克拉克·马克斯韦(1831--1 
879)对从这些发现产生的电磁场方程的数学形式感到疑惑。他以惊人的灵感,对这些方 
程作了初看起来似乎非常微小的,但却是含义深远的改变。这个改变根本不是由已知的 
实验事实(虽然与之相协调)暗示的。这是马克斯韦理论自身所要求的结果,部分是物 
理学上的,部分是数学上的,还有部分是美学上的。马克斯韦方程的一个含义是电磁场 
的确在空虚的空间中相互“推挤”。振动的磁场产生振动的电场(这是法拉第的实验发 
现所隐含的)。而振动的电场又反过来产生振动的磁场(由马克斯韦理论推导得来的) 
,并且这又接着产生电场等等。(这种波的详图见312页的图6.26和313页的图6.27。) 
马克斯韦能够算出这种效应在空间传播的速率--并且他发现这正是光的速率!此外,这 
些所谓的电磁波还展示出了很久以来就知道的于涉和令人困惑的极化性质(我们在第六 
章269,311页还要回到这些上来)。除了说明波长在一个特定范围(4�7×107米)的 
可见光的性质外,还预言了导线中电流产生的其他波长的电磁波。出色的德国物理学家 
亨利希·赫兹于1888年在实验上证实了这种波的存在。法拉第的富有灵感的希望在美妙 
的马克斯韦方程中的确找到了坚实的基础! 
  
  虽然我们在这儿并不必了解马克斯韦方程的细节,稍微看看它们是什么样子的并没 
有什么害处: 
  
  此处E、B和j分别为电尝磁场和电流;ρ为电荷密度,c只是一个常数,也就是光速1 
1。不必忧虑curl及div等项,它们简单地表示不同类型的空间变化。(它们是某种相对 
于空间座标的偏微分算符的组合。可以回想我们在讨论哈密顿方程时遇到的用符号表示 
的偏微分运算。)在前面两个方程左边出现的算符/t实际上和用在哈密顿方程的点一样 
,其不同之处只是技术性的。这样E/t表示电场的变化率,而B/t表示磁场的变化率。第 
一个方程①说明电场如何按照磁场和电流在该时刻的行为而变化;而第二个方程说明磁 
场如何按照电场在该时刻的行为而变化。第三个方程粗略地讲是反平方律的另一种形式 
,它是讲(该时刻的)电场必须和电荷分布相关;而第四个方程对磁场说同样的东西, 
除了在这情况下没有“磁荷”(或分开的“北极”或“南极”粒子)以外。 
  
  这些方程在下面这一点和哈密顿的很相像,即依据在任何给定时刻的电场和磁场的 
值,它们给出了这些量对时间的变化率。所以马克斯韦方程和通常的哈密顿理论一样是 
决定论的。仅有的也是一个重要的差别是,马克斯韦方程是场方程而不是粒子方程。这 
表明我们需要用无限个参数去描述系统的态(空间中的每一点的场矢量),而不仅仅需 
要像在粒子论中的有限的数目参数(每个粒子的三个位置和三个动量座标)。因此马克 
斯韦理论的相空间是无限维的!(正如我以前提到过的,一般的哈密顿框架,实际上可 
以包容马克斯韦方程。但由于这无限的维数,该框架必须稍微推广一下12。) 
  
  马克斯韦理论为我们的物理实在的图像添加上具有根本性的新的部分。我们必须接 
受场自身的存在,而不能把它仅仅当作牛顿物理中的“实在”粒子的数学的附属物。在 
这一点上它超越了我们的原先的理论框架。马克斯韦的确向我们指出,当场以电磁波传 
播时,它们自身携带一定量的能量。他还给出了这种能量的显明的表达式。从一处传播 
到另一处的“脱离物体”的电磁波能传递能量的这一惊人事实,最终由赫芝在实验上探 
测到它的存在而被证实。这个事实虽然如此惊人,而现在却变成这么熟悉的东西了。 
  
  
  
可计算性和波动方程 
  
  
  
  马克斯韦能直接从他的方程推导出,在没有电荷或电流(亦即在上述方程中j=0,ρ 
=0)的空间区域,所有电磁场的分量必须满足一称为波动方程①的方程。由于波动方程 
是有关于一个单独的量的,而不是电磁场的所有六个分量的方程,所以可视作马克斯韦 
方程的“简写”。它的解表现了类似波动的行为,并牵涉到诸如马克斯韦理论的“极化 
”(电场矢量的方向,见311页)等等其他复杂性。 
  
  因为波动方程及其可计算性的关系已被清楚地研究过,所以我们对它格外有兴趣。 
事实上,玛利安·玻依堪·玻--埃勒和因·里查德(1979,1981,1982,还可参阅1985 
)指出,尽管波动方程在平常的意义上具有决定性的行为,--亦即初态数据一被提供, 
则其他时刻的解即被决定--还存在某种古怪类型的可计算的初始数据,它使得在以后可 
计算的时刻被决定的场的值实际上是不可计算的。这样,此一似是而非的物理场论的方 
程(虽然不完全是在我们世界中实际成立的马克斯韦方程)会在玻--埃勒和里查德的意 
义上产生不可计算的演化! 
  
  这结果在表面上似乎相当令人震惊--这看来和我在上一节的猜测相抵触,除了那时 
人们关心的是“合理的”哈密顿系统的可能的可计算性以外。然而,玻--埃勒和里查德 
结果固然是惊人的并和数学有关系,它和猜测的冲突并没有什么真正的物理意义。原因 
在于,他们“古怪”的初始数据不以一种通常人们对物理上有意义的场所要求的方式而 
“光滑地改变”13玻--埃勒和里查德实际上证明了,如果我们不容许这一类场,则不会 
产生不可计算性。无论如何,甚至如果允许这类场,很难想象任何物理“仪器”(诸如 
人脑?)能利用这样的“不可计算性”。这只有当允许作任意高精度的测量时才相干。 
但正如我说过的,这在物理上不是非常现实的,尽管如此,玻�埃勒和里查德的结果 
代表了一个重要研究领域的美妙开端,迄今这个领域还很少被研究过。 
  
  
  
洛伦兹运动方程;逃逸粒子 
  
  
  
  马克斯韦方程本身还不是一个完整的方程组。如果给定了电荷和电流的分布,则它 
们提供了电磁场传播方式的美妙的描述。在物理上,这些电荷主要是我们知道的电子和 
质子等带电粒子,而电流是由这种粒子的运动所引起的。如果我们知道这些粒子在何处 
并如何运动,则马克斯韦方程告诉我们电磁场会如何行为。该方程并没有告诉我们这些 
粒子自身如何行为,此问题的部分答案在马克斯韦年代即已经知道,但直到1895年杰出 
的荷兰物理学家亨德里克·安东·洛伦兹利用与狭义相对论有关的思想去推导现在称之 
为带电粒子的洛伦兹运动方程后(参阅威塔克(1910)310页,395页),才得到了令人满 
意的方程组。这些方程告诉我们带电粒子的速度如何因所处的电磁场的影响而连续地改 
变14。把洛伦兹方程和马克斯韦方程相联立,人们便能同时得到带电粒子的电磁场的时 
间演化的规则。 
  
  然而,这一套方程并非一切都相安无事。如果一直到粒子的自身的直径的尺度之下 
(电子的“经典半径”大约为10-15米)场都是非常均匀的,而且粒子运动也不过分激烈 
的话,则它们给出了极好的结果。但此处存在一个原则上的困难,在其他情况下它会变 
得重要起来。洛伦兹方程要我们去做的是考察带电粒子所在处的准确的那一点的电磁场 
(并且实际上提供了该点的“力”)。如果粒子是有限尺度的,则那一点应如何选取呢 
?是否我们应取粒子的“中心”,或是对表面上所有点的场(“力”)取平均?如果场 
在粒子尺度下不是均匀的,则这就产生了差异。还有更严重的问题:粒子表面(或中心 
)的场究竟如何?记住我们考虑的是一个带电的粒子。粒子本身引起的电磁场必须叠加 
到粒子所处的地方的“背景场”上去。粒子的自身场在靠近“表面”处变得极强,并且 
轻而易举地糟塌它附近的所有其他的场。而且,围绕着自身的粒子场会多多少少地指向 
外面(或内面)。这样粒子所要反应的总的实际场根本不是均匀的,在粒子“表面”的 
不同地方指向不同的方向,更不要说它的“内部”了(图5.15)。现在我们必须开始忧 
虑,互异的作用到粒子上的力是否使之旋转或变形,我们必须知道它的弹性性质等等( 
并且这里还有一个和相对论有关的特别有疑问的问题,我先不在此烦恼读者)。显然, 
这个问题比初看时复杂得多。 
  
  
  
  
  
  也许我从一开始就把粒子当作点粒子会更好些。但这会导致另一类问题,因为在粒 
子的近邻处其自身的电场会变成无穷大。按照洛伦兹方程,如果它必须对它所处的地方 
的电磁场响应,则它必须对此无穷大的场响应!为了使洛伦兹力定律有意义,必须找出 
一种减去粒子自身的场以剩下的有限的背景场的方法,这样粒子才能毫不含糊地对背景 
场响应。1938年狄拉克(我们在后面还要提到他)解决了这个问题。但是,狄拉克解导 
出了某些令人恐慌的结论。他发现为了决定粒子和场的行为,不但必须知道每个粒子的 
初始位置和速度,也必须知道其初始加速度(这是一种在标准的动力学理论的范围内不 
太正常的情况)。对大多数的初始加速度值,粒子的最终行为变得完全疯狂,它自发地 
加速并很快地趋近于光速!这就是狄拉克的“逃逸解”,它并不对应于任何实际发生在 
自然里的东西。人们必须找到一种正确选择初始加速度以避免逃逸解的方法。只有一个 
人使用“先知”--也就是,必须指明能最终导出逃逸解的初始加速度并避免之,才能做 
到。这根本就不是在一个标准的决定性的物理问题中选择初始条件的方法。在传统的决 
定论中,这些初始数据可以任意给定,不受任何未来的行为要求的约束。而在这里,不 
仅是将来完全决定了在过去某一时刻的应选取的初始值,而且这些非常特别的数据由于 
要使未来行为确实“合理”的要求,而被非常苛刻地约束。 
  
  基本的经典方程就只能走到这么远。读者会意识到经典物理定律中决定性和可计算 
性的问题真是乱麻一团,在物理学定律中是否有一个目的论的因素呢?未来是否对过去 
允许发生的事有某种影响呢?在实际上,物理学家并未认真地将这些经典电动力学(经 
典带电粒子和电磁场的理论)的含义当作实在的描述。他们对上述困难通常回答是,带 
电的单独粒子问题是在量子电动力学范畴里,我们不能指望利用纯粹经典过程得到有意 
义的答案。这无疑是对的。但正如我们以后将要看到的,在这一点上量子理论自身也有 
问题。事实是,狄拉克正是因为想到,也许能为解决(物理上更适当的)量子问题中的 
甚至更大的基本困难得到灵感,而考虑带电粒子的经典问题。以后我们必须面临量子理 
论的这个问题! 
  
爱因斯坦和彭 永诚 义相对论 
  
  
  
  我们回顾一下伽利略的相对性原理。它告诉我们,如果我们从一个静止座标系转换 
到运动座标系,伽利略和牛顿的物理定律完全不变。这意味着仅仅考察在我们周围的物 
体的动力学行为,不能确定我们是处于静止状态,还是沿着某一方向作匀速运动。(回 
忆一下187页描述伽利略在海上的船)。当我们将马克斯韦方程合并到这些定律中去时, 
伽利略的相对论仍然对吗?我们知道马克斯韦电磁波以固定的速率--即光速传播。常识 
似乎告诉我们,如果我们在某一方向非常快地运动,则光在那一方向相对我们的速率应 
减少到比c小(因为我们沿着那个方向去“追逐”光线),而且在相反的方向光速应相应 
地增加到比c大(因为我们向着光运动)--这都和马克斯韦理论的不变的值c不一致。确 
实,常识似乎是对的:合并的牛顿和马克斯韦方程不满足伽利略相对论。 
  
  正是由于对这件事体的忧虑导致爱因斯坦于1905年--事实上彭加莱在他之前(1898-- 
1905)--提出狭义相对论。彭加莱和爱因斯坦各自独立地发现马克斯韦方程也满足一个相 
对论原理(参阅派斯1982);也就是如果我们从一个静止座标系换到运动座标系时,方 
程也有类似的不变的性质。虽然在这种情况下,变换规则和伽利略--牛顿物理不相容! 
为了使两者相容,必须修正其中的一组方程--或者抛弃相对论原理。 
  
  爱因斯坦不想抛弃相对论原理。他凭着超等的物理直觉坚持,这个原则必须对于我 
们世界的物理定律成立。此外,他知道伽利略--;牛顿物理对于所有的已知现象,只在速 
度和光速相比很微小的情况下被检验,这时不相容性不显著。只有光本身才牵涉到速度 
大到足以使这种偏离变重要。所以,正是光的行为才能告诉我们究竟要采用何种相对论 
原理--而制约光的方程正是马克斯韦方程。这样适合于马克斯韦理论的相对论原理要保 
留;而相应地伽利略--牛顿定律要作修正! 
  
  在彭加莱和爱因斯坦之前,洛伦兹也着手并回答了问题。直到1895年,洛伦兹采取 
的观点认为将物质结合在一起的力量具有电磁性(后来证明正是如此)。这样,实在物 
体的行为应该满足从马克斯韦方程推导出的定律。其中一个推论,是以与光速可相比拟 
的速度运动的物体在运动的方向会有微小的收缩(所谓的“费兹杰拉德--洛伦兹收缩” 
)。洛伦兹利用它来解释迈克尔逊和莫雷在1887年进行的令人困惑的实验发现。该实验 
似乎指出不能用电磁现象来确定一个“绝对”静止的坐标系。(迈克尔逊和莫雷指出, 
地球表面上的光的表观速度不受地球绕太阳公转的影响,这和预想的非常不一样。)是 
否物体的行为总是这样,以至于不可能在局部检验它的匀速运动呢?这是洛伦兹的近似 
的结论;而且他只局限于物体的特殊的,也就是认为只有电磁力才有意义的理论。作为 
一位杰出的数学家,彭加莱在1905年指出,马克斯韦方程基础的相对论原理,物体有一 
个精确的行为方式使得局部检测物体的匀速运动根本办不到。他并透彻地了解了此原理 
的物理含义(包括我们很快就要考虑到的“同时性的相对性”)。他认为这仅仅是一种 
可能性,而不像爱因斯坦那样坚持相对论原理必须成立。 
  
  马克斯韦方程满足的相对性原理后来被称作狭义相对论。要掌握它不甚容易。它有 
许多反直观的特征,一下子很难把这些特征当作我们生活其中的世界的性质接受下来。 
事实上,若不是富有创见和洞察力的俄国/德国几何学家赫曼·闵可夫斯基(1864--1909) 
于1908年引进了进一步的要素,很难对狭义相对论赋予意义。闵可夫斯基曾是爱因斯坦 
在苏黎士高等理工学院的导师。1908年,闵可夫斯基在他发表在哥廷根大学的著名演讲 
中说道: