第三章　场，相对论_物理学的进化_爱因斯坦_在线阅读

1.场的图示

在19世纪下半叶，革命性的新观念被引入了物理学，它们为一种不同于旧力学观的新哲学观开辟了道路。法拉第（Faraday）、麦克斯韦（Maxwell）和赫兹（Hertz）的研究成果发展了现代物理学，创造了新的概念，形成了一幅新的实在图景。

现在我们就来阐述这些新概念给科学带来的突破，以及它们是如何逐渐清晰起来并获得力量的。我们将对发展线索进行逻辑重构，而不太在意时间上的先后。

这些新概念的起源与电现象有关，但第一次介绍它们时，从力学入手要更简单。我们知道，两个粒子会相互吸引，这种吸引力与距离的平方成反比。我们可以用一种新的方法来描述这个事实，尽管这样做的好处一时还不清楚。下图中的小圆代表一个吸引体，比如太阳。实际上，应该把这幅图想象成空间中的一个模型，而不是一张平面图。于是，图中的小圆其实代表空间中的一个球体，比如太阳。把一个被称为检验体的物体置于太阳附近，它将被太阳吸引，引力沿着两个物体中心的连线。因此，图中的线表示太阳对检验体各个位置的引力。每条线的箭头表明这个力指向太阳，也就是说这个力是引力。这些线都是引力场的力线。这暂时还只是个名称，无须进一步强调。这幅图有一个典型特征，我们将在以后强调。力线是在没有物质的空间中构造的。所有力线，或者说场，目前只表明一个被置于球体（场就是为它构造的）附近的检验体会如何行为。

在我们的空间模型中，力线总是与球面垂直的。它们都是从一点发散出去的，因此在球体附近最密，越远越疏。如果与球体的距离增加到2倍或3倍，那么在我们的空间模型中，力线的密度将会减小到1/4或1/9。因此力线有两重目的：一方面显示了球体（例如太阳）附近的物体所受力的方向；另一方面，空间中力线的密度又显示了力如何随距离而变化。场的图案描绘了引力的方向及其与距离的关系。由这样一幅图可以领会引力定律的含义，就像从对引力作用的语言描述或者精确简洁的数学语言中可以领会引力定律的含义一样。这种场的图示也许显得清晰而有趣，但没有理由认为它标志着任何实际进展。很难证明它对引力有什么用处。也许有人觉得，不妨认为这些线不仅仅是画，而是有真实的力的作用沿着它们通过。这样想象当然可以，但那样一来，必须假定沿着这些力线的作用速度是无穷大！根据牛顿定律，两个物体之间的力只与距离有关，与时间无关。力从一个物体传到另一个物体竟然不需要时间！但凡明白事理的人都不会相信速度无穷大的运动，因此，认为我们的图不仅仅是模型不会有什么结果。

不过，我们并不准备讨论引力问题。我们介绍这些，只是为了对电学理论中类似的推理方法作出简化的解释而已。

我们先来讨论一个很难作力学解释的实验。假定电流通过一个线圈，线圈中央有一根磁针。电流通过的瞬间会产生一个新的力，这个力作用于磁极，并且垂直于线圈与磁极的任何连线。如果这个力是由一个作回转运动的电荷产生的，那么正如罗兰的实验所表明的，这个力与电荷的速度有关。这些实验事实违反了一个哲学观点，即所有力都必须沿着粒子的连线起作用，且只能与距离有关。

精确表达电流作用于磁极的力是非常复杂的，事实上比表达引力复杂得多。然而，就像对引力那样，我们也可以尝试把这种作用视觉化。我们的问题是：电流以什么样的力作用于被放置在它附近的磁极呢？要想用语言来描述这种力是相当困难的，即使用数学公式也一定非常复杂和别扭。最好是用绘有力线的图或空间模型把我们关于作用力的一切认识都表示出来。困难之一在于，一个磁极总是与另一个磁极关联着存在，它们共同形成了偶极子。不过我们总是可以设想磁针很长，只须考虑作用于距离电流较近的那个磁极的力，另一极距离太远，作用于它的力可以忽略。为避免混淆，我们假定距离导线较近的磁极是正的。

作用于正磁极的力的特性可以从下图看出来。

如图所示，导线旁边的箭头表示电流从高电势流向低电势的方向。所有其他线都是属于这个电流的力线，都处在某个平面上。表示电流对正磁极的作用的力矢量的方向和长度都可以从图上看出来。我们知道，力是矢量，确定力必须知道它的方向和长度。我们主要关注作用于磁极的力的方向问题，这个问题是：如何从图中找到空间中任一点的力的方向？

要在这样一个模型中看出力的方向，不像之前的例子那么简单，因为在前面那个例子中力线是直线。为了澄清步骤，下图中只画了一条力线。如图所示，力矢量位于力线的切线上，力矢量的箭头和力线上的箭头指着同一方向，即在这一点上力作用于磁极的方向。一张好图，或者说一个好的模型，也能把任一点上力矢量的长度表示出来。在力线较密亦即靠近导线的地方，力矢量必须较长，而在力线较疏亦即远离导线的地方，力矢量必须较短。

这样一来，力线或场就能使我们确定在空间中任一点作用于磁极的力。眼下，这乃是对我们精心建构的场的唯一辩护。知道了场表示什么，我们会带着更浓厚的兴趣来考察对应于电流的力线。这些力线都是围绕着导线的一些圆圈，所处的平面垂直于导线所在平面。从图中领会到力的特征之后，我们再次得出结论：力的作用方向垂直于导线与磁极之间的任何连线，因为圆的切线总与半径垂直。我们对作用力的全部了解都可以在场的构造中得到概括。为了简单地描述作用力，我们把场的概念置于电流概念与磁极概念之间。

任何电流都与一个磁场相联系，也就是说，通电导线附近的磁极总是受到一个力的作用。顺便提及，这种性质使我们能够制作一种灵敏的仪器来探测电流的存在。一旦知道如何从电流的场模型来看磁力的特性，我们就能画出通电导线周围的场，以表示磁力在空间任一点的作用。我们的第一个例子是所谓的螺线管。事实上，它就是下图所示的一卷导线。我们希望通过实验来了解与流经螺线管的电流有关的磁场的知识，并把这些知识融入场的构造中。该图已经把结果描绘出来了。弯曲的力线是闭合的，它们以电流磁场特有的方式包围着螺线管。

我们也可以用描绘电流磁场的方式来描绘磁棒的磁场。如下图所示，力线从正极指向负极。力矢量总是处于力线的切线上，且在磁极附近最长，因为这些地方力线的密度最大。力矢量表示磁棒对正磁极的作用。这里场“源”是磁棒而不是电流。

这两幅图应当认真比较一下。第一幅图是流经螺线管的电流的磁场，第二幅图则是磁棒的场。我们忽略螺线管和磁棒，只看它们外面的两个场，就会立刻注意到，它们的性质是完全一样的，两者的力线都是从螺线管或磁棒的一端指向另一端。

场的图示结出了它的第一个果实！倘若不通过场的构造来揭示，我们就很难看出流经螺线管的电流与磁棒之间有这么大的相似性。

现在我们可以对场的概念进行更严格的检验。我们很快会看到，场并不只是一种关于作用力的新图示。让我们暂时假定场以一种独特的方式刻画了场源所规定的一切作用。这仅仅是个猜测。它的意思是，如果螺线管与磁棒有同样的场，则它们所有的影响也必定相同。也就是说，两个通电的螺线管会和两根磁棒一样彼此吸引或排斥，引力或斥力只依赖于它们的相对距离，这与两根磁棒的情况完全相同。它还意指，螺线管与磁棒之间也会像两根磁棒那样相互吸引或排斥。简而言之，通电螺线管的所有作用都与相应磁棒的作用一样，因为只有场能起这些作用，而场在这两种情况下有相同的性质。实验完全证实了我们的猜测！

倘若没有场的概念，发现这些事实将会多么困难！要把通电导线与磁极之间的作用力表示出来是非常复杂的。如果是两个螺线管，我们就不得不研究两个电流的相互作用力。但如果借助于场的概念来研究，既已发现螺线管的场类似于磁棒的场，我们便立即可以注意到所有这些作用的特性。

我们现在更有理由把场看成某种东西了。就描述现象而言，似乎只有场的性质是最重要的，场源的差异并不重要。场的概念的重要性在于能够引出新的实验事实。

事实证明，场是一个非常有用的概念。起初，它只是为了描述作用力而被置于场源与磁针之间的某种东西。它被视为电流的“代理者”，电流的一切作用都通过它来完成。但是现在，代理者也充当诠释者，它把定律翻译成一种简单易懂的清晰语言。

场的描述的首获成功暗示着，借助于场这个诠释者来间接考察电流、磁棒和电荷的所有作用也许很方便。可以认为，场总与电流联系在一起。即使没有磁极去检验场是否存在，场也总在那里。让我们沿这条新的线索追溯下去。

我们可以像介绍引力场、电流或磁棒的场那样来介绍带电导体的场。再举一个最简单的例子。要想绘制一个带正电球体的场，必须知道一个带正电的小检验体被置于作为场源的带电球体附近时会受到什么力的作用。我们使用带正电的检验体而不用带负电的，仅仅是出于习惯，表明力线的箭头应该朝哪个方向画。这个模型之所以类似于前面引力场的模型，是因为库仑定律与牛顿定律相似。两个模型的唯一差别就是箭头的方向相反。的确，两个正电荷相互排斥，两个质量则相互吸引。然而，带负电球体的场与引力场相同，因为带正电的小检验体会被场源吸引。

假如电极和磁极都静止，它们之间就不会有作用，既没有吸引，也没有排斥。如果用场的语言来表达这一事实，我们可以说：静电场并不影响静磁场，反之亦然。“静场”是指不依时间变化的场。如果没有外力干扰，磁棒和电荷可以靠得很近而永不发生作用。静电场、静磁场和引力场的性质各有不同。它们不会混合，而会各自保持个性，无论是否有其他场存在。

让我们回到带电球体。它一直静止着，现在假设在某个外力的作用下开始运动。带电球体在运动，这句话用场的语言来表达就是：电荷的场随时间而变化。但罗兰的实验告诉我们，带电球体的运动相当于电流，而任何电流必定伴随着磁场，因此我们的推理链条是：

　　　　　　　电荷的运动→电场的变化

　　　　　　　　↓

　　　　　　　电流→伴随的磁场

由此我们断定：电荷运动所产生的电场变化总是伴随着磁场。

我们的结论建立在奥斯特实验的基础上，但其意涵远不止于此。它包含着这样一种认识：把随时间变化的电场与磁场联系起来对于接下来的事情至关重要。

只要电荷静止，就只有静电场。一旦电荷开始运动，磁场就出现了。而且电荷越大，运动越快，电荷运动所产生的磁场就越强。这也是罗兰实验的一个推论。用场的语言来说：电场变化越快，伴随的磁场就越强。

这里我们试图把熟知的事实从按照旧力学观构造的电流体语言翻译为场的新语言。稍后我们会看到，这种新的语言是多么清晰、有益和深刻。

2.场论的两个支柱

“电场的变化总是伴随着磁场”。若把“电”与“磁”互换一下，这句话就成了“磁场的变化总是伴随着电场”。这种说法是否正确，只有实验才能判定。然而，正是由于使用了场的语言，我们才会想到提出这个问题。

一百多年前，法拉第做实验发现了感生电流。

这个实验演示起来很简单。我们只需一个螺线管或其他某个电路，一根磁棒以及检验电流是否存在的仪器。起初，形成闭合电路的螺线管附近有一根静止的磁棒。由于没有源，导线中没有电流通过，只存在磁棒的不随时间变化的静磁场。现在，我们迅速改变磁棒的位置，使之远离或靠近螺线管。这时导线内会出现极短时间的电流，然后又消失了。每当磁棒位置改变，电流就会重新出现，这可以用足够灵敏的仪器检测出来。但从场论的观点来看，电流意味着电场的存在，这个电场迫使电流体在导线中流动。当磁棒再次静止时，电流便消失了，因而电场也消失了。

假定我们现在还不知道场的语言，而要用旧力学观的语言对这些实验结果进行定性和定量的描述，则这个实验可以表达成：磁偶极子的运动产生了一个新的力，这个力推动导线中的电流体流动。接下来的问题是：这个力与什么有关？这很难回答。我们不得不研究这种力与磁棒速度的关系、与磁棒形状的关系以及与线圈形状的关系。不仅如此，如果用旧语言来解释，那么这个实验无法告诉我们，用另一个通电电路的运动来代替磁棒的运动是否也能产生感生电流。

如果使用场的语言，并再次相信作用由场决定，情况就完全不同了。我们立刻可以看到，通电的螺线管会起到和磁棒一样的作用。下图中有两个螺线管：一个较小，其中有电流通过，另一个较大，其中的感生电流可以检验出来。像前面移动磁棒那样移动小螺线管，大螺线管中便会产生感生电流。此外，为了产生和消除磁场，我们不必移动小螺线管，而只需通过断开和闭合电路来产生和消除电流。我们再次看到，场论提出的新事实又被实验证实了！

再举一个简单点的例子。取一个没有任何电流源的闭合导线，它的附近有一个磁场。至于这个磁场的源是另一个通电电路还是一根磁棒，这并不重要。下图显示了闭合电路和磁力线。用场的语言很容易对感应现象作出定性和定量的描述。如图所示，一些力线穿过了导线围成的表面。我们需要考察的是穿过导线围成的那部分平面的力线。无论场多强，只要场不变，就不会有电流。然而，只要穿过导线围成的表面的力线数目发生变化，导线中就立刻会有电流流过。电流由穿过该表面的力线数目的变化来决定，无论这种变化是如何引起的。对于感生电流的定性和定量描述，力线数目的变化是唯一重要的概念。“力线数目的变化”意指力线的密度在变化，我们还记得，这意味着场强在变化。

于是，我们推理链条中的几个关键点是：磁场的变化→感生电流→电荷的运动→电场的存在。

因此，变化的磁场总是伴随着电场。

这样我们就找到了支撑电场和磁场理论的两个最重要的支柱。第一个支柱是变化的电场与磁场有关联，它源于奥斯特的磁针偏转实验，并且导出了这样一个结论：变化的电场总是伴随着磁场。

第二个支柱则把变化的磁场与感生电流关联起来，它源于法拉第的实验。两者成为定量描述的基础。

同样，与变化磁场相伴随的电场似乎亦是某种真实的东西。此前我们必须设想，即使没有磁极作检验，电流的磁场也依然存在。同样，这里必须认为，即使没有导线来检验感生电流是否存在，电场也依然存在。

事实上，这两个支柱可以归结为一个，即以奥斯特实验为根据的那个支柱。法拉第的实验结果可以由这个支柱和能量守恒定律推导出来。我们说有两个支柱只是为了清晰和简洁。

场的描述还有另一个结果需要提及。假设有一个以伏打电池为电流源的通电电路。导线与电流源之间的连接突然断开，当然现在不再有电流。然而在电流中断的一瞬间却发生了一个复杂的过程，这个过程同样只有用场论才能预见到。在电流中断之前，导线周围有一个磁场。电流中断的一瞬间，这个磁场便不复存在。因此，正是由于电流的中断，磁场才消失。穿过导线围成的表面的磁力线数目变化极快。但这种迅速变化无论是怎样产生的，必定会产生感生电流。真正重要的是，磁场的变化越大，感生电流就越强。这个结果是对场论的又一个检验。电流的断开必定伴随着强烈而短暂的感生电流的出现。实验再次证实了这个预言。断开过电流的人都会注意到有火花产生，火花显示了磁场的迅速变化所引起的强大电势差。

这个过程也可以从能量的观点去看。磁场消失，火花产生。火花代表能量，因此磁场也必定代表能量。为了前后一致地使用场的概念及其语言，我们必须把磁场看成能量的储藏所。只有这样，我们对电现象和磁现象的描述才能符合能量守恒定律。

起初，场只不过是一个有用的模型，而现在却变得越来越真实了。它帮助我们理解了旧事实，并引导我们认识新事实。把能量归于场是物理学发展中的一大步，场的概念越来越被强调，对力学观不可或缺的实体概念越来越被抑制。

3.场的实在性

所谓的麦克斯韦方程总结了对场的定律的定量数学描述。迄今为止我们所提到的事实都导向了这些方程，但方程的内容却比我们所能指出的丰富得多。在麦克斯韦方程简单的形式之下隐藏着深刻的内容，只有通过认真研究才能将其揭示出来。

麦克斯韦方程的提出是自牛顿时代以来物理学中最重要的事件，不仅因为它内容丰富，而且也因为它成了一种新型定律的典范。

麦克斯韦方程的典型特征可见于现代物理学的所有其他方程，我们可以用一句话来概括它：麦克斯韦方程是描述场的结构的定律。

为什么麦克斯韦方程在形式和特征上都不同于经典力学方程呢？说这些方程描述了场的结构，这是什么意思呢？如何根据奥斯特和法拉第的实验结果提出一种对物理学的未来发展至关重要的新型定律呢？

从奥斯特的实验中我们已经看到，磁场围绕一个变化的电场盘卷起来。从法拉第的实验中我们又看到，电场围绕一个变化的磁场盘卷起来。为了概述麦克斯韦理论的一些典型特征，我们暂时只关注这两个实验中的一个，比如法拉第的实验。再看看变化的磁场产生感生电流的那幅图。我们知道，如果穿过导线所围成的表面的力线数目发生变化，就会产生感生电流。因此，无论是磁场变化还是电路发生变形或移动，都会出现电流。也就是说，只要穿过表面的磁力线数目发生了变化，无论是由什么引起的，都会出现电流。若把所有这些可能性都考虑进来以讨论它们的特殊影响，势必会引出一种非常复杂的理论。但能否把这个问题简化呢？让我们试着不去考虑与电路的形状、长度以及导线围成的表面有关的一切因素，想象这幅图中的电路变得越来越小，渐渐收缩成一个极小的线圈，只包含空间的某一点。这样一来，与形状和大小有关的因素就完全不相干了。在闭合曲线收缩成一点的这个极限过程中，我们自然而然不再考虑线圈的大小和形状，由此得到的定律把磁场和电场在任一时刻和空间中任何一点的变化联系在一起。

这是通向麦克斯韦方程的主要步骤之一。它同样是想象出来的理想实验，即用一个缩成一点的电路来重复法拉第的实验。

我们其实应当称它为半步，而不是一整步。到目前为止，我们的注意力一直集中在法拉第的实验上，但建立在奥斯特实验基础上的场论的另一个支柱也必须同样认真地加以考察。在这个实验中，磁力线在电流周围盘卷起来。把环形的磁力线缩成一点，就迈出了剩余半步。而整个这一步给出了磁场和电场在任一时刻和空间中任何一点的变化之间的关联。

此外，还有重要的一步需要迈出。根据法拉第的实验，必须有导线来检验电场是否存在，正如在奥斯特的实验中必须有磁极或磁针来检验磁场是否存在一样。但麦克斯韦的新理论观念超越了这些实验事实。在麦克斯韦的理论中，电场和磁场，或者简单地说电磁场，是某种实在的东西。变化的磁场总会产生电场，不论是否有导线去检验电场的存在；变化的电场也总会产生磁场，不论是否有磁极去检验磁场的存在。

因此，提出麦克斯韦方程需要两个关键步骤。第一，在思考奥斯特的实验和罗兰的实验时，必须把围绕电流和变化的电场盘卷起来的磁场的环形力线缩成一点；在思考法拉第的实验时，必须把围绕变化的磁场盘卷起来的电场的环形力线缩成一点。第二，认识到场是某种实在的东西；电磁场一旦产生出来，就会按照麦克斯韦的定律而存在、作用和变化。

麦克斯韦方程描述了电磁场的结构。这些定律的适用场所是整个空间，而不像力学定律那样，只适用于有物质或电荷存在的一些点。

我们还记得，在力学中，如果知道一个粒子在某一时刻的位置和速度，又知道作用力，就可以预知这个粒子的整个未来路经。在麦克斯韦的理论中，如果知道场在某一时刻的情况，就可以由理论方程推出整个场在空间和时间中如何变化。就像力学方程使我们能够追溯物质粒子的历史，麦克斯韦方程亦能使我们追溯场的历史。

但力学定律与麦克斯韦定律之间仍然有一个重要区别。比较一下牛顿的引力定律与麦克斯韦的场定律，就能显示出这些方程所表达的一些典型特征。

借助于牛顿定律，我们可以由太阳与地球之间的作用力推出地球的运动。牛顿定律把地球的运动与太阳的作用联系在一起。地球和太阳虽然相距甚远，但都是力的演出中的演员。

在麦克斯韦的理论中，根本没有物质演员。该理论的数学方程表达了支配电磁场的定律。它们不像牛顿定律那样把两个相隔很远的事件联系在一起，不是把此地发生的事情与彼地的条件联系在一起。此时此地的场只与刚刚过去那个时刻直接邻域的场有关。如果知道此时此地发生的事情，我们就可以借助于这些方程预测空间上稍远的位置以及时间上稍迟的时刻会发生什么，进而一步步增加对场的了解。把这些很小的步骤加起来，就可以从远处发生的事情推出此处发生的事情。而牛顿理论则恰恰相反，它只容许一些把遥远的事件联系起来的大步骤。奥斯特和法拉第的实验都可以从麦克斯韦的理论中重新获得，但要想做到这一点，只能把受麦克斯韦方程支配的各个小步骤加起来。

若对麦克斯韦方程进行更深入的数学研究，我们便可以得出一些新的出乎意料的结论，从而能在更高的层次上检验整个理论，因为理论的推论现已定量，可以通过一连串逻辑论证揭示出来。

我们再来设想一个理想实验。假定在外界影响下，一个带电小球像钟摆一样有节奏地快速振荡起来。根据我们关于场的变化所掌握的知识，如何用场的语言来描述这里正在发生的事情呢？

电荷的振荡产生了变化的电场，而变化的电场又总是伴随着变化的磁场。如果把闭合电路放在附近，那么这个变化的磁场又会伴随着电路中的电流。所有这些都只是重复已知的事实，但研究麦克斯韦方程可以使我们更深地理解振荡电荷的问题。从麦克斯韦方程出发进行数学推导，我们可以查明振荡电荷周围场的性质、在场源近处和远处的结构以及随时间的变化。这样推理出来的结果就是电磁波。振荡的电荷辐射出能量，能量以一定的速度穿越空间；但能量的转移——一种状态的运动——乃是一切波动现象的特性。

我们已经考察过几种不同类型的波：既有球体的振动所产生的纵波，密度变化经由介质传播出去；又有在一种胶状介质中传播的横波，球体转动所导致的胶状物的形变经由介质传播出去。那么电磁波传播的是什么种类的变化呢？正是电磁场的变化！电场的每一次变化都会产生磁场，这个磁场的每一次变化又会产生电场，……，电场和磁场就这样相互产生下去。由于场代表能量，以特定速度在空间中传播的所有这些变化就形成了一个波。从理论中可以推出，电力线和磁力线总处于与传播方向垂直的平面上，因此形成的波是横波。我们根据奥斯特和法拉第的实验而形成的场的图像仍然保持着原有的特征，但我们现在认识到，它有着更深的意义。

电磁波是在空荡荡的空间中传播的，这同样是麦克斯韦理论的一个推论。如果振荡电荷突然停止运动，它的场就成了静电场。但电荷振荡所产生的一系列波继续在传播。这些波独立存在着，其变化的历史可以追溯，就像追溯任何其他物质对象的历史一样。

麦克斯韦方程描述了电磁场在空间中任一点和任一时刻的结构，由这些方程可以推出，电磁波在空间中以一定的速度传播着，并且随时间变化。

还有一个非常重要的问题：电磁波是以多大的速度在空间中传播的呢？借助于与波的实际传播无关的一些简单实验的数据，麦克斯韦的理论给出了明确回答：电磁波的速度等于光速。

奥斯特和法拉第的实验是麦克斯韦定律的基础。这些定律是用场的语言表达的。我们前面谈到的所有结果都来自于对这些定律的认真研究。电磁波以光速传播，这一理论发现是科学史上最伟大的成就之一。

实验证实了理论的预言。50年前，赫兹第一次证明了电磁波的存在，并且用实验证实了它的速度等于光速。今天，千千万万的人都在见证电磁波的发送和接收。他们的仪器远比赫兹的仪器复杂，这些仪器能够探测到距离波源数千英里以外波的存在，而不是只有几米开外。

4.场和以太

电磁波是以光速在空间中传播的横波。光速等于电磁波的速度，这暗示光学现象与电磁现象之间有密切的关系。

如果不得不在微粒说与波动说之间作出抉择，那么我们决定支持波动说。光的衍射是影响我们作出这一决定的最有力论据。但假定光波是一种电磁波不仅不会违反任何对光学事实的解释，相反还会得出其他结论。假如真是这样，那么物质的光学性质与电学性质之间必定存在着某种联系，这种联系可以从麦克斯韦的理论中推导出来。事实上，我们的确可以推出这样的结论，而且禁得起实验的检验，这是支持光的电磁说的关键论据。

这个重大成果归功于场论。两个看似无关的科学分支被同一个理论统一了起来。同一套麦克斯韦方程既可以描述电磁感应，又可以描述光的折射。如果我们的目标是用一个理论来描述业已发生或可能发生的一切现象，那么光学与电学的结合无疑是向前迈进了一大步。从物理学的观点来看，普通电磁波与光波的唯一区别是波长：光波的波长很短，肉眼就可以检测到，而普通电磁波的波长很长，需要无线电接收器才能检测出来。

旧力学观试图把自然之中的所有事件都归结为物质粒子之间的作用力。电流体理论就是建立在这种力学观基础上的第一种朴素理论。在19世纪初的物理学家看来，场并不存在，只有实体和实体的变化才是真实的。他试图只用直接涉及两个电荷的概念来描述两个电荷之间的作用。

起初，场的概念仅仅是方便我们从力学观去理解现象的一种工具。而在新的场语言中，对于理解电荷的作用至关重要的不是电荷本身，而是对电荷之间场的描述。人们对新概念的认识逐渐加深，以至于后来场的重要性超过了实体。大家意识到，物理学中发生了非常重要的事情。一种新的实在被创造出来，这是一个在力学描述中没有地位的新概念。经过一番努力，场的概念在物理学中渐渐取得了领导地位，直到今天也仍然是一个基本的物理概念。在现代物理学家看来，电磁场就和他所坐的椅子一样实在。

但是，如果认为新的场论已经使科学摆脱了旧的电流体理论的错误，或者说新理论摧毁了旧理论的成就，那是不公平的。新理论既显示了旧理论的局限性，也显示了它的优点，使我们能从一个更高的层次上重新获得旧概念。不仅电流体和场的理论是如此，任何物理理论的变化，无论看起来多么具有革命性，都是如此。例如，我们仍然可以在麦克斯韦的理论中看到电荷概念，尽管这里的电荷仅仅是电场的一个源。库仑定律仍然有效，作为诸多推论之一包含在麦克斯韦方程中。我们仍然可以应用旧理论，只要研究的事实处于该理论的有效范围之内。但我们也可以应用新理论，因为一切已知事实都包含在新理论的有效范围之内了。

借用一个比喻，我们可以说，创立新理论与其说像摧毁一个旧仓库，在那里建起一座摩天大楼，倒不如说更像在爬山，随着视野变得越来越宽广，会发现我们的出发点与周围的广大区域之间有着意想不到的关联。但我们的出发点还在那里，仍然可见，只不过显得更小了，成为我们克服种种阻碍爬上山峰之后获得的宽广视野中一个极小的部分。

的确，人们很久才认识到麦克斯韦理论的全部内容。起初，大家都以为借助于以太，最后总可以用力学方法来解释场。后来渐渐意识到，这种纲领是行不通的，场论的成果已经太显著和重要，以致不可能用力学教条来替换它。另一方面，为以太设计力学模型的问题似乎变得越来越没有意义，那些假设的牵强与人为愈发令人沮丧。

现在唯一的出路似乎是理所当然地认为空间具有传送电磁波的物理属性，而不去过分在意这句话的含义。我们仍然可以使用“以太”这个词，但只是为了表达空间的某种物理属性。在科学的发展过程中，“以太”这个词的含义已经屡次改变。此时它已不再是一种由粒子构成的介质。它的故事还没有结束，相对论将它继续了下去。

5.力学框架

故事进行到这个阶段，我们必须回到开头，即伽利略的惯性定律。我们再次引用它：

任何物体都会保持其静止或匀速直线运动状态，除非有外力迫使其改变这种状态。

一旦理解了惯性概念，我们对它似乎已经没有更多可说的了。虽然我们已经详细讨论过这个问题，但并没有穷尽。

设想有一位严肃的科学家，他相信可以用实际的实验来证明或否证惯性定律。他沿着水平的桌面推动小球，并尽可能地消除摩擦。他注意到，桌面和小球越光滑，运动就越均匀。正当他要宣布惯性原理时，有人突然给他开了一个玩笑。我们的物理学家在一个与外界完全隔绝的无窗房间里工作。开玩笑之人安装了某种机械装置，使整个房间可以围绕一根穿过其中心的轴迅速旋转。旋转一经开始，这位物理学家便得到了出乎预料的新体验。一直在匀速运动的小球试图远离房屋中心，尽可能地靠近房间墙壁。他本人亦感到有一种奇特的力把他推到墙上。他的感觉与转急弯的火车或汽车中的人的感觉很相似，与旋转木马上的人的感觉更相似。他之前得到的所有成果于此毁于一旦。

我们这位物理学家不得不连同惯性定律放弃所有力学定律。惯性定律是他的出发点，倘若这个出发点改变了，他所有进一步的结论也就改变了。一个观察者如果注定要在这个转动的房间度过一生，并且在里面做所有实验，那么他将得到与我们不同的力学定律。另一方面，如果他进入房间时对物理学的原理已经有了深刻的认识和坚定的信念，那么他会解释说，力学之所以看起来出了毛病，是因为房间在旋转。借助于力学实验，他甚至可以查明房间是如何旋转的。

我们为什么对旋转房间中的这位观察者这么感兴趣？这是因为在我们的地球上，在某种程度上我们也处于同样的状况。自哥白尼时代以来我们已经知道，地球在绕轴自转并且绕太阳运转。在科学的发展中，即使是这个大家都很清楚的简单观念也并非未受触动。不过让我们暂时抛开这个问题，接受哥白尼的观点。如果这位旋转的观察者无法验证力学定律，那么我们在地球上也应当无法验证。不过地球旋转得较慢，因此影响并不很明显。尽管如此，许多实验都显示与力学定律有微小偏差，可以认为，这些偏差的一致性证明了地球在转动。

可惜我们无法置身于太阳与地球之间，在那里证明惯性定律的严格有效性，并且观察一下旋转的地球。只有在想象中才能做到这些。所有实验都只能在我们居住的地球上进行。这一事实常常被更科学地说成：地球是我们的坐标系。

为了更清楚地表明这些词的意思，不妨举一个简单的例子。我们可以预言从塔上丢下的石头在任一时刻的位置，并通过观察来验证我们的预言。将一根量杆置于塔旁，我们便可以预言落体在任一时刻会与量杆上的哪个标记重合。显然，我们不能用橡胶或实验时会发生变化的其他任何材料来制作塔和量杆。事实上，我们的实验原则上只需要一把与地球刚性连接的刻度不变的标尺以及一个走时准确的钟。有了这两件东西，我们不仅可以忽视塔的建筑设计，甚至可以忽视塔的存在。上述假设都很平凡，描述这些实验时通常不会提到。但这种分析表明，我们的每一句陈述背后都隐藏着许多假设。这里我们假定存在着一根刚性的量杆和一个理想的钟，否则我们就无法检验伽利略的落体定律。有了这些简单而基本的物理仪器，一根量杆和一个钟，我们就能在一定的准确度上验证这个力学定律。认真做这个实验，就会发现理论与实验之间有些偏差，这是因为地球在旋转，或者换句话说，因为这里表述的力学定律在与地球刚性连接的坐标系中并非严格有效。

在所有力学实验中，无论是什么类型，我们都必须确定质点在某一时刻的位置，就像在上述实验中确定落体的位置一样。但位置必须相对于某种东西来描述，比如在上述实验中相对于塔和标尺来描述位置。我们需要某个所谓的参照系，这是一个用来确定物体位置的力学框架。若要描述物体和人在城市中的位置，大街小巷就是我们的参照系。迄今为止，我们引用力学定律时从未关注过参照系，因为我们碰巧生活在地球上，在任何情况下都不难固定一个与地球刚性连接的参照系。我们的所有观察都参照的这个由刚性的不变物体构成的参照系被称为坐标系。

迄今为止，我们所有的物理陈述都缺少某种东西。我们没有注意到，一切观察都必须在某个坐标系中进行。我们没有描述这个坐标系的结构，而是径直忽视了它的存在。例如我们曾说“一个物体在匀速运动……”，其实我们应该这样说：“一个物体相对于某个选定的坐标系在匀速运动……。”那个旋转房屋的实验告诉我们，力学实验的结果也许依赖于我们选择的坐标系。

如果两个坐标系作相对转动，那么力学定律不可能在两者中都有效。若把一个游泳池当作其中一个坐标系，而且它的水面是平的，那么在另一个坐标系来看，这类游泳池中的水面就是弯的，这是用茶匙搅动咖啡的人所熟知的现象。

在表述力学的主要线索时，我们忽略了很重要的一点。我们并没有说它们相对于哪一个坐标系有效。于是，整个经典力学都悬在半空中，因为我们不知道它是相对于哪一个坐标系而言的。不过，这个困难我们暂且不去考虑。我们要做一个略有不确的假设，即在任何与地球刚性连接的坐标系中，经典力学的定律都有效。这样做是为了把坐标系固定下来，使我们的陈述明确起来。虽然说地球是一个合适的参照系并不完全正确，但我们暂且接受它。

因此，我们假定存在着一个力学定律在其中有效的坐标系。这样的坐标系只有一个吗？假定有一个相对于地球在运动的坐标系，比如一列火车、一艘船或一架飞机，在这些新的坐标系中，力学定律都有效吗？我们确实知道它们并非总是有效，比如火车转弯，船在风暴中颠簸，飞机在尾旋下降时。我们先看一个简单的例子。假定有一个坐标系在相对于我们的“好”坐标系（即力学定律在其中有效的坐标系）匀速运动，比如一列沿直线匀速行驶的理想火车或一艘平稳航行的轮船。我们从日常经验中得知，这两个坐标系都是“好的”，在匀速行驶的火车或轮船中所做的物理学实验和在地面上做的实验将会给出完全相同的结果。但如果火车突然停止或加速，或者海面起了风浪，就会发生奇怪的事情。在火车里，箱子从行李架上掉下来；在船上，桌椅东歪西倒，乘客也晕船了。从物理学的观点来看，这只表明力学定律不适用于这些坐标系，它们是“坏”坐标系。

这个结果可以表达为所谓的伽利略相对性原理：如果力学定律在一个坐标系中有效，那么它们在相对于这个坐标系作匀速直线运动的任何其他坐标系中也有效。

假定有两个相对作非匀速运动的坐标系，则力学定律不可能在两者中都有效。“好”坐标系就是力学定律在其中有效的坐标系，称为惯性系。至于惯性系是否存在，这个问题直到现在也没有解决。但只要有这样一个系统，就会有无数个这样的系统。任何相对于初始惯性系作匀速直线运动的坐标系都是惯性系。

考虑这样一种情形：两个坐标系从已知位置出发，以已知的速度相对作匀速直线运动。喜欢具象思维的人可以设想是一艘船或一列火车相对于地面在运动。无论在地面上还是在相对地面作匀速直线运动的火车或船上，都能以同样的精确度对力学定律进行实验验证。但是，假如两个系统的观察者分别站在各自系统的立场上开始讨论对同一事件的观察，便会出现某种困难。每个人都想把对方的观察翻译成自己的语言。再举一个简单的例子：从地球和作匀速直线运动的火车这两个坐标系来观察一个粒子的同样运动。这两个坐标系都是惯性系。如果两个坐标系在某一时刻的相对速度和相对位置均为已知，那么是否只要知道了在一个坐标系中的观察结果，就可以查明在另一个坐标系中的观察结果呢？描述事件时，必须知道如何从一个坐标系过渡到另一个坐标系，因为这两个坐标系是等价的，同样适合于描述自然事件。事实上，只要知道一个坐标系中的观察者获得的结果，就可以知道另一个坐标系中的观察者所获得的结果。

让我们更抽象地考虑这个问题，不用船或火车。为简便起见，我们只研究直线运动。假定有一根带有刻度的刚性量杆和一个准时的钟。在直线运动的简单情形中，刚性量杆就像伽利略实验中塔上的标尺一样代表一个坐标系。在直线运动的情形中，把坐标系想象成一根刚性量杆，在任意运动的情形中，把坐标系想象成一个由相互平行和垂直的量杆所组成的刚性框架，总要更简单、更好，塔、墙、街道等则不必考虑。假定在这种最简单的情形中有两个坐标系，即两根刚性量杆，我们把一根画在另一根上面，分别称之为“上”坐标系和“下”坐标系。假定这两个坐标系以某个速度作相对运动，一根沿着另一根滑动。还可以假定两根量杆均为无限长，只有起点没有终点。这两个坐标系只用一个钟就够了，因为时间的流逝对这两个坐标系是一样的。观察开始时，两根量杆的起点是重合的。此时质点的位置在两个坐标系中是用同一个数来刻画的。这个质点与量杆刻度上的某一点重合，这样就给出了确定该质点位置的数。但假如两根量杆相对作匀速运动，那么过了一段时间，比如1秒钟，则与位置相应的数将会不同。考虑静止于上量杆的一个质点，确定它在上坐标系中位置的数不随时间而改变，但下量杆上相应的数却随时间而改变。我们不说“质点位置对应的数”，而会简要地说“质点的坐标”。于是我们从图上看到，下面这句话虽然听起来很复杂，却是正确的，而且表达的意思非常简单。质点在下坐标系的坐标等于它在上坐标系的坐标加上上坐标系的原点在下坐标系的坐标。重要的是，只要我们知道质点在一个坐标系中的位置，就能计算出它在另一个坐标系中的位置。为此，我们必须知道这两个坐标系在每一个时刻的相对位置。这些内容虽然听起来很学术，其实很简单，若不是后面还会用到，几乎不值得作这些详细讨论。

这里要注意确定质点的位置与确定事件的时间之间的差别。每一个观察者都有他自己的量杆作为他的坐标系，但他们所有人都只有一个钟。时间是某种“绝对的”东西，对于所有坐标系中的所有观察者来说都以相同的方式流逝。

再举一个例子。一个人以每小时3英里的速度在一艘大船的甲板上散步。这是他相对于船的速度，或者说是他相对于一个与船刚性连接的坐标系的速度。假定船相对于岸的速度是每小时30英里，而且人与船沿同一方向作匀速运动，那么这个散步的人相对于岸上一位观察者的速度将是每小时33英里，相对于船是每小时3英里。我们可以把这个事实说得更抽象一些：一个运动质点相对于下坐标系的速度等于它相对于上坐标系的速度加上或减去上坐标系相对于下坐标系的速度，是加是减要看速度方向相同还是相反。因此，如果知道两个坐标系的相对速度，我们可以把位置和速度从一个坐标系变换到另一个坐标系。位置（或坐标）和速度都是这样一些量的例子，它们在不同的坐标系中有所不同，并且由一些（在这个例子中非常简单的）变换定律联系在一起。

然而，有些量在两个坐标系中是相同的，所以无须变换定律。比如在上量杆上取两个固定点，考察它们之间的距离。这个距离便是两点的坐标之差。为了找到这两个点相对于不同坐标系的位置，我们不得不使用变换定律。但如图所示，在构造两个位置的差异时，不同坐标系所产生的影响相互抵消了。我们得先加上再减去两个坐标系原点之间的距离。因此，两点之间的距离是不变的，也就是与坐标系的选择无关。

下一个与坐标系无关的量的例子是速度的变化，这个概念我们在力学中已经很熟悉了。假定从两个坐标系去观察一个沿直线运动的质点。在每一个坐标系中的观察者看来，质点的速度变化是两个速度之差，而两个坐标系的相对匀速运动所产生的影响在计算两者之差时消去了，因此速度的变化是一个不变量，当然，只有当两个坐标系相对作匀速直线运动时才是如此。否则，速度变化在每一个坐标系中也会不同，这种不同是由代表我们坐标系的两根量杆的相对运动的速度变化带来的。

现在举最后一个例子。假定有两个质点，其间的作用力只与距离有关。在直线运动的情况下，距离是不变量，因而力也是不变量。因此，把力与速度的变化联系起来的牛顿定律在两个坐标系中都有效。我们再次得到了一个被日常经验所确证的结论：如果力学定律在一个坐标系中有效，那么它们在相对于该坐标系作匀速直线运动的一切坐标系中都有效。当然，我们的例子非常简单，是坐标系可以用一根刚性量杆来代表的直线运动的例子。但我们的结论却普遍有效，可以将它们概括为以下几条：

1.我们不知道有什么规则能够找到一个惯性系。但只要给出一个惯性系，就能找到无数个，因为所有相对作匀速直线运动的坐标系，只要其中一个是惯性系，就全都是惯性系。

2.与一个事件相对应的时间在所有坐标系中都相同。而坐标和速度却并非如此，它们依照变换定律而改变。

3.虽然从一个坐标系过渡到另一个坐标系时坐标和速度会改变，但力和速度变化相对于变换定律却是不变的，因此力学定律相对于变换定律也是不变的。

我们把这里针对坐标和速度而提出的变换定律称为经典力学的变换定律，或者简称经典变换。

6.以太和运动

伽利略相对性原理对于力学现象是有效的。同样的力学定律适用于一切作相对运动的惯性系。那么对于非力学现象，尤其是场的概念被证明非常重要的那些现象，这条原理也是有效的吗？与这个问题有关的一切问题立刻把我们带到了相对论的出发点。

我们还记得，光在真空或者说以太中的速度是3×108米每秒，光是一种在以太中传播的电磁波。电磁场携带着能量，这种能量一旦从它的源辐射出去，就有了独立的存在性。虽然我们已经深知以太在力学结构上有许多困难，但我们暂时还是继续认为电磁波和光波在以太介质中传播。

设想我们坐在一个与外界完全隔绝的封闭房间里，空气既不能进来也不能出去。如果我们坐着说话，那么从物理的观点来看，我们是在制造声波，它以声音在空气中的速度从静止的声源传播出去。倘若口耳之间没有空气或其他物质介质，我们就听不到声音。实验表明，如果没有风，而且空气在我们所择定的坐标系中是静止的，那么声音在空气中的速度沿各个方向都是一样的。

现在想象我们的房间匀速穿过空间。屋外的人可以透过运动房间（如果你愿意，也可以说火车）的玻璃墙看到里面发生的一切。他可以根据屋内观察者的测量结果推导出声音相对于与他那个环境相连的坐标系的速度，房间正是相对于这个坐标系运动的。这又是前面已经讨论很多的那个老问题，即已知在一个坐标系中的速度，如何确定在另一个坐标系中的速度。

屋内的观察者宣称：在我看来，声音沿各个方向的速度都是一样的。

屋外的观察者则宣称：在我的坐标系中确定的、在运动的房间中传播的声音速度沿各个方向并不相等。沿着房间运动方向的声速比标准声速大，逆着房间运动方向的声速比标准声速小。

这些结论都是从经典变换中得出的，可以通过实验来验证。房间携带着它里面传播声音的空气介质一起运动，因此声速对于屋内和屋外的观察者是不同的。

根据把声音看成在物质介质中传播的波的理论，我们还可以推出其他结论。要想听不到某个人的声音，我们可以（尽管这绝非最简单的方法）相对于他周围的空气以大于声速的速度向前奔跑，这样一来，产生的声波就永远也到达不了我们的耳朵了。另一方面，如果我们错过了一个永远也不会重复的重要的词，我们必须以大于声速的速度追赶声波去捕捉那个词。这两个例子并没有什么不合理的地方，只不过我们都必须以大约400码每秒的速度奔跑。但我们可以想象，随着未来技术的进一步发展，这样的速度是可以实现的。大炮射出的炮弹的速度其实要大于声速，因此骑在这样一颗炮弹上的人永远也听不到发射炮弹的声音。

所有这些例子都是纯力学性的，现在我们可以提出一些重要的问题：我们刚才就声波所说的内容是否也适用于光波呢？伽利略相对性原理和经典变换是否既适用于力学现象，又适用于光学和电学现象呢？对于这些问题，如果只是简单地回答“是”或“否”而不深究它们的含义，那是很危险的。

在相对于屋外观察者作匀速直线运动的房间中的声波的情形中，以下两个中间步骤对于我们的结论是必不可少的：

运动的房间携带着传播声波的空气一起运动。

在相对作匀速直线运动的两个坐标系中观察到的速度通过经典变换联系起来。

至于光的相应问题则要表述得略有不同：屋内的观察者不再是说话，而是朝各个方向发出光信号或光波。我们进一步假定，发出光信号的光源永远静止在房间里。光波在以太中运动，就像声波在空气中运动一样。

房间是否会像带着空气一起运动那样带着以太一起运动呢？我们没有以太的力学图像，所以很难回答这个问题。如果房间是封闭的，里面的空气就不得不随它运动。想象以太也是如此，这显然没有意义，因为所有物质都浸在以太之中，以太是无处不在的。任何门都关不住以太。所谓“运动的房间”现在仅仅指与光源刚性连接的一个运动的坐标系。但我们并非不能设想与光源一起运动的房间带着以太一起运动，就像封闭的房间带着声源和空气一起运动一样。但我们同样可以设想相反的情形：房间穿过以太，就像船穿过绝对平静的大海一样，不把介质的任何部分带走而只是穿过它而已。在我们的第一幅图像中，房间带着光源和以太一起运动。在这种情况下，我们可以与声波做类比，得出完全相似的结论。在我们的第二幅图像中，房间带着光源运动，但不带着以太运动。在这种情况下就不能与声波做类比了，在声波的情况下得出的结论并不适用于光波。这是两种极端的可能性。我们还可以设想更复杂的可能性，比如随光源一起运动的房间只携带部分以太。但在我们查明实验支持这两种较为简单的极限情形中的哪一种之前，没有理由讨论更为复杂的假设。

我们先讲第一幅图像，假定房间带着与之刚性连接的光源和以太一起运动。如果我们相信那个应用于声波速度的简单的变换原理，那么现在也可以把结论应用于光波。我们没有理由怀疑这条简单的力学变换定律，它不过是说，某些情况下速度必须相加，某些情况下速度必须相减。我们暂时假定随光源一起运动的房间带着以太走，并且假定经典变换成立。

如果我打开灯，光源与我的房间刚性地连接在一起，那么光信号的速度将是那个著名的实验值3×108米每秒。但屋外的观察者会注意到房间的运动，因此也会注意到光源的运动。既然以太被带着一起走，他一定会得出这样的结论：在我的屋外坐标系中，沿不同方向的光速是不同的。沿着房间运动方向的光速比标准光速大，逆着房间运动方向的光速比标准光速小。我们的结论是：如果随光源一起运动的房间带着以太走，而且力学定律是有效的，那么光速必定与光源的速度有关。如果光源朝着我们运动，从运动光源到达我们眼睛的光的速度就会较大，如果光源背离我们运动，光速就会较小。

倘若我们的速度大于光速，我们就应当可以逃开光信号。我们可以追上此前发送的光波，从而看到过去发生的事件。我们追上它们的顺序与它们被发送的顺序相反，地球上发生的一连串事件看起来会像从后往前放映电影一样，先讲故事的结局。这些结论都源于一个假设，即运动的坐标系带着以太一起走，以及力学变换定律是有效的。倘若如此，光与声音的类比就是完美的。

然而，没有迹象表明这些结论是真的。恰恰相反，为证明这些结论而作的所有观测都与之相违背。由于光速极大，会造成很多技术上的困难，所以这个裁定是从非常间接的实验中得到的，但其明确性没有任何疑问。无论光源是否在运动以及如何运动，光速在所有坐标系中都相同。

这个重要的结论可以从许多实验中得出来。我们不准备详细描述这些实验，但可以作一些非常简单的论证。这些论证虽然并未证明光速与光源的运动无关，但能让这个事实令人信服和可以理解。

在我们的太阳系中，地球和其他行星都围绕太阳运转。我们不知道是否还有其他行星系与太阳系相似。不过，存在着许多由两颗恒星组成的双星系，两颗恒星围绕着它们的引力中心转动。通过观察这种双星的运动，我们发现牛顿的引力定律是有效的。现在假定光的速度依赖于发射体的速度，那么恒星发出的光线是更快还是更慢就要看恒星发光时的速度。在这种情况下，整个运动将会非常混乱，我们不可能通过遥远的双星来确证支配我们整个行星系运动的同一个引力定律的有效性。

我们再来考察一个实验，它所依据的观念非常简单。想象有一个飞速旋转的轮子。根据我们的假设，以太被轮子的运动所携带，并且参与运动。轮子静止或运动时，经过轮子附近的光波的速度会有所不同。静止以太中的光速不同于被轮子迅速带动的以太中的光速，正如声波的速度在无风和有风的日子会有所不同。但这种差异根本检测不到！无论从哪一个角度切入这个主题，无论设计出什么样的判决性实验，结果总是与运动会带动以太这一假设相矛盾。于是，在一些更详细的专业论证的支持下，我们得出了以下结论：

光速并不依赖于光源的运动。

运动物体不会带动周围的以太。

因此，我们必须放弃声波与光波的类比，转而研究第二种可能性：所有物质都在以太中运动，而以太不参与任何运动。这意味着我们要假定存在着一个以太海，所有坐标系都静止其中或者相对于它运动。我们暂且不谈实验能否证明这个理论，先来熟悉一下这个新假设的含义以及从中能够推出什么结论。

有这样一个坐标系，它相对于以太海是静止的。在力学中有许多相对作匀速直线运动的坐标系，但没有一个坐标系可以被区分出来。所有这些坐标系都同样“好”或同样“坏”。如果有两个相对作匀速直线运动的坐标系，在力学中问其中哪一个运动、哪一个静止是毫无意义的。我们只能观察到相对的匀速直线运动。伽利略相对性原理使我们无法谈及绝对的匀速直线运动。不仅存在着相对的匀速直线运动，而且存在着绝对的匀速直线运动，这句话是什么意思呢？它不过是说，有这样一个坐标系，一些自然定律在它之中不同于在所有其他坐标系之中。此外，每一个观察者都可以把在自己坐标系中有效的定律与在那个唯一的标准坐标系中有效的定律加以比较，以判定他自己的坐标系究竟是静止还是运动。这里的情况与经典力学不同，在经典力学中，伽利略的惯性定律使得绝对的匀速直线运动是毫无意义的。

如果假设运动是穿过以太的，那么在场的现象领域中可以得出什么结论呢？这意味着有一个坐标系与所有其他坐标系都迥然不同，它相对于以太海是静止的。显然，在这个坐标系中有些自然定律必定是不同的，否则说“运动穿过以太”就没有意义了。如果伽利略相对性原理是有效的，那么运动穿过以太将毫无意义。这两种观念是无法调和的。然而，倘若存在一个由以太确定的特殊坐标系，那么说“绝对运动”或“绝对静止”就有了明确的意义。

其实我们没有选择的余地。为了拯救伽利略相对性原理，我们曾假定坐标系在运动时带着以太一起走，但发现与实验不符。唯一出路就是放弃伽利略相对性原理，尝试假定一切物体都在平静的以太海中运动。

下一步就是考察一些结论，它们违反伽利略相对性原理，支持运动穿过以太，并付诸实验检验。这样的实验容易设想，但很难做。由于我们这里只关注思想，所以不必操心技术上的困难。

我们再回到前述的运动房间和屋内屋外的两位观察者。屋外的观察者代表由以太海指定的标准坐标系，在这个与众不同的坐标系中，光速总是具有同样的标准值。以太海中的所有光源，无论是静止还是运动，传播出来的光速都是一样的。房间和它的观察者都穿过以太而运动。设想房间中央的灯忽然发出闪光，随即熄灭，并设想房间的墙是透明的，因此屋内屋外的两位观察者都能测量光速。假如问这两位观察者期待得到什么样的结果，他们的回答大概会是这样：

屋外的观察者：我的坐标系由以太海指定，我的坐标系中的光速总是那个标准值。我不必理会光源或其他物体是否在运动，因为它们绝不会把我的以太海带走。我的坐标系区别于所有其他坐标系。在这个坐标系中，无论光束的方向或光源的运动如何，光速必定是其标准值。

屋内的观察者：我的房间穿过以太海而运动。房间的一面墙在远离光，另一面墙在靠近光。倘若我的房间相对于以太海以光速运动，那么从房间中央发出的光永远也到不了以光速远离它的那面墙。假如房间的运动速度小于光速，那么从房间中央发出的光波将先到达某一面墙。它将先到达朝着光波运动的墙，再到达远离光波运动的墙。因此，虽然光源与我的坐标系刚性连接，但沿各个方向的光速却不会相同。在相对于以太海运动的方向上光速较小，因为墙在远离；在相反的方向上光速较大，因为墙在朝着光波运动，所以遇到光波早些。

因此，只有在以太海所指定的那个坐标系中，各个方向上的光速才是相等的。而在相对于以太海运动的其他坐标系中，光速与我们的测量方向有关。

凭借刚才考察的判决性实验，我们可以检验运动穿过以太海的理论。事实上，大自然为我们提供了一个高速运动的系统——每年绕太阳运转一周的地球。如果我们的假设是正确的，那么沿着地球运动方向的光速将会不同于逆着地球运动方向的光速。这种差异可以计算出来，并且可以设计出恰当的实验加以验证。由于该理论预言的时间差很小，所以必须有非常精巧的实验安排。著名的迈克耳孙－莫雷实验（Michelson-Morley experiment）实现了这个目的，它未能发现光速与方向有什么关系，从而宣判了所有物质都在平静的以太海中穿行的理论死刑。倘若假设以太海理论，那么不仅光速，而且其他与场有关的现象也会显示出与运动坐标系的方向有关。每一个实验都与迈克耳孙－莫雷实验一样给出了否定的结果，从未表明与地球的运动方向有任何关系。

局面变得越来越严重了。两条假设我们都已经试验过了。第一个是说运动物体带着以太走，它违反了光速与光源的运动无关这个事实。第二个是说存在着一个独特的坐标系，运动物体不是带着以太走，而是在永远平静的以太海中穿行。如果是这样，那么伽利略相对性原理就是无效的，光速不可能在每一个坐标系中都相等。这同样与实验相矛盾。

还有更加人为的理论被试验过，认为真理介于这两个极限情形之间，运动物体只携带一部分以太。但这些理论都失败了。事实证明，借助于以太的运动，穿过以太的运动，或者同时用这两种运动来解释运动坐标系中的电磁现象的所有努力均以失败而告终。

这样便出现了科学史上最富戏剧性的局面之一。所有关于以太的假设都行不通！实验的判决总是否定的。回顾物理学的发展我们可以看到，以太自出生之日起便是物理实体家族中“令人难堪的孩子”。首先，我们构造不出简单的以太力学模型，只好作罢，这在很大程度上导致了力学观的崩溃。其次，我们不再指望通过以太海的存在来区分出一个坐标系，使我们既能识别相对运动又能识别绝对运动。除了带着波一起走，这将是以太显示和证明自己存在的唯一方式。我们想让以太变得实在的一切努力都失败了。它既显示不出其力学结构，又显示不出绝对运动。除了发明以太时赋予它的性质，即传播电磁波的能力，所有其他性质都没有留下来。我们试图发现以太的性质，却导致了困难和矛盾。有过这么多糟糕的经历，现在是彻底忘掉以太，再也不提它名字的时候了。我们说：空间具有传播波的物理属性，这样便省去了那个我们决定避开的词。

当然，从我们的词汇中删去一个词是于事无补的。我们遇到的麻烦太大了，根本无法以这种方式来解决！

我们现在把已经被实验充分验证的事实写下来，不再操心“以太”问题。

1. 光在真空中的速度永远为标准值，与光源或光的接受者的运动无关。

2. 在两个相对作匀速直线运动的坐标系中，所有自然定律都完全等同，无法区分出绝对的匀速直线运动。

有许多实验确证了这两点，没有一个实验与其中任何一点相矛盾。第一点表达了光速的不变性，第二点则把为力学现象提出的伽利略相对性原理推广到一切自然现象。

在力学中，我们已经看到：如果一个质点相对于一个坐标系有某个速度，那么它在相对于前一坐标系作匀速直线运动的另一个坐标系中的速度将会有所不同。这一结论源于简单的力学变换原理。这些原理是从我们的直觉（人相对于船和岸运动的例子）中直接得来的，似乎不会有什么错误。但这个变换定律与光速不变性是矛盾的。或者换句话说，我们需要补充第三条原理。

3. 位置和速度是根据经典变换从一个惯性系变换到另一个惯性系的。

矛盾是显而易见的。我们不能把（1）（2）（3）结合在一起。

经典变换看起来极为自明和简单，似乎无法加以改变。我们已经尝试改变过（1）和（2），但与实验结果不一致。所有关于“以太”运动的理论都要求修改（1）和（2），但这毫无用处。我们再次意识到困难的严重性。我们需要一条新的线索，那就是接受（1）和（2）这两条基本假设，而放弃（3），尽管这看起来很奇怪。这条新线索始于对最基本、最原始概念的分析，我们这就来说明这种分析如何迫使我们改变了旧观点，从而消除了所有困难。

7.时间、距离、相对论

我们的新假设是：

（1）在所有相对作匀速直线运动的坐标系中，光在真空中的速度都相同。

（2）在所有相对作匀速直线运动的坐标系中，一切自然定律都相同。

相对论就是以这两条假设为出发点的。从现在开始，我们不再使用经典变换了，因为我们知道它与这两条假设相矛盾。

就像科学中向来所做的那样，这里需要把我们那些常常未经评判便加以接受的根深蒂固的偏见除去。既然我们已经看到，改变（1）和（2）会与实验相矛盾，我们就必须勇于承认它们是有效的，转而处理那个可能的弱点，即如何把位置和速度从一个坐标系变换到另一个坐标系。我们打算从（1）和（2）中推出结论，看看这两条假设与经典变换矛盾在何处，是怎样矛盾的，并且找到这些结论的物理意义。

我们再次使用屋内屋外有两位观察者的运动房间的例子。从房间中央发出一个光信号，我们再问这两个人期待观察到什么。此时他们只接受上述两条原理，忘却了以前所说的关于光在介质中穿行的内容。他们回答如下：

屋内的观察者：从房间中央发出的光信号将同时到达房间的各面墙，因为各面墙与光源距离相等，光沿各个方向传播的速度又相等。

屋外的观察者：光在我坐标系中的速度与随房间运动的观察者的坐标系中完全一样。在我看来，光源是否在我的坐标系中运动并不重要，因为光源的运动不会影响光速。我看到光信号以标准速度朝各个方向行进。一面墙试图远离光信号，另一面墙则试图靠近光信号。因此，光信号碰到远离的墙要比碰到靠近的墙稍迟一些。如果房间的速度比光速小很多，那么这个时间差会极小，但光信号依然不会同时碰到这两面与运动方向垂直的相对的墙。

比较了这两位观察者的预言之后，我们发现了一个非常惊人的结果，它与一些有着牢固基础的经典物理学概念明显相矛盾。在屋内的观察者看来，两束光到达两面墙这两个事件是同时的，而在屋外的观察者看来却并非同时。在经典物理学中，对于所有坐标系中的所有观察者，我们都只有一个钟，时间的流逝是一样的。时间以及像“同时”、“较早”、“较晚”这样的词都有一种绝对的意义，与任何坐标系都没有关系。在一个坐标系中同时的两个事件，在所有其他坐标系中也必定同时。

（1）和（2）这两条假设，也就是相对论，迫使我们放弃这种观点。我们已经描述过，在一个坐标系中同时的两个事件在另一个坐标系中却不是同时的。我们的任务就是要理解这个结果，理解“在一个坐标系中同时的两个事件，在另一个坐标系中可能不是同时的”这句话的意思。

“在一个坐标系中同时的两个事件”是什么意思呢？每个人从直觉上似乎都知道这句话的意思。但我们必须谨慎，力求给出严格的定义，因为我们知道过分重视直觉有多么危险。我们先来回答一个简单的问题。

什么是钟？

对于时间的流逝，原始的主观感受使我们能够排列出印象的次序，判定一件事发生得较早，另一件事发生得较晚。但要表明两个事件的时间间隔为10秒钟，就需要一个钟。钟的使用使时间概念成了客观的。只要能够精确重复任意多次，任何物理现象都可以当作一个钟来使用。若把这样一个事件的首尾时间间隔取作时间单位，那么重复这个物理过程就可以测量任何时间间隔。所有的钟，从最简单的沙漏到最精密的仪器，都是以这个想法为基础的。比如沙漏的时间单位就是沙从上面玻璃瓶流入下面玻璃瓶的时间间隔，倒转玻璃瓶则可以重复这个物理过程。

两个离得很远的点上有两个完美的钟，所指示的时刻完全相同。如果不考虑作出验证，这句话总该是正确的。但它到底是什么意思呢？我们如何才能确信两个相距很远的钟总是指示完全相同的时刻呢？一个可能的办法是使用电视。需要注意的是，电视只是作为一个例子，对于我们的论证并不重要。我可以站在一个钟的旁边看着另一个钟在电视上的图像，然后可以判断它们是否同时指示着相同的时刻。但这并不是一个好的证明。电视图像是电磁波传递的，因此是以光速传播的。我们在电视上看到的图像是很短时间以前发出的，而我们在实际的钟上所看到的却是现在发生的。这个困难很容易避免。我必须在两个钟的中点处取这两个钟的电视图像，在这个中点上观察它们。于是，如果信号是同时发出的，则它们将同时到达我。如果从中点处观察的两个好钟总是指示相同的时刻，则它们就很适合指示在距离很远的两点发生的事件的时间。

在力学中我们只用了一个钟。但这并不很方便，因为我们必须在这个钟附近来进行所有测量。若从远处看钟，比如通过电视去看，我们就必须牢记：我们现在看到的事情其实是以前发生的，一如我们是在日落发生以后8分钟才看到日落的。我们必须根据我们与钟的距离对时间读数作出修正。

因此，只有一个钟是不方便的。但是现在，既然我们已经知道如何判断两个或更多个钟是否同时指示相同的时刻，是否走得同样快慢，我们完全可以在给定的坐标系中设想任意多个钟，其中每一个都能帮助我们确定在它附近发生的事件的时间。所有这些钟都相对于坐标系静止，它们都是“好”钟，都是同步的，就是说同时指示相同的时刻。

关于钟的这种安排并没有什么特别奇怪的。我们现在使用很多个同步的钟，而不是只使用一个，因此很容易判断在给定的坐标系中，两个遥远的事件是否同时发生。两个事件发生时，如果它们附近同步的钟指示同样的时刻，则它们就是同时的。“两个相距遥远的事件，其中一个比另一个发生得更早”，这一说法现在有了明确的意义。所有这些都可以用静止在我们坐标系中的同步的钟来判断。

这与经典物理学是一致的，也没有出现与经典变换相矛盾的地方。

为了定义什么是同时的事件，我们借助于信号来使钟同步。我们在安排时，务必使信号以光速传播，光速在相对论中发挥着非常根本的作用。

既然要讨论两个相对作匀速直线运动的坐标系的重要问题，我们就需要考察两根量杆，每一根都配有一些钟。两个坐标系相对作匀速直线运动，每一个坐标系中的观察者现在都有他自己的量杆和牢牢固定在量杆上的一组钟。

在经典力学中讨论测量时，我们把一个钟用于所有坐标系。而在这里，每一个坐标系都有多个钟。这个差别并不重要。一个钟足够用了，但只要能精确同步，没有人会反对使用多个钟。

我们正在接近一个关键点，表明经典变换在哪里违反了相对论。当两组钟相对作匀速直线运动时会发生什么？经典物理学家会回答说：什么也没有发生，它们仍然会走得一样快，我们既可以用静止的钟也可以用运动的钟来指示时间。按照经典物理学的看法，在一个坐标系中同时的两个事件，在任何其他坐标系中也是同时的。

但这并非唯一可能的答案。我们同样可以设想运动的钟与静止的钟有不同的快慢。我们现在来讨论这种可能性，暂时不去判断钟在运动时是否真的会改变快慢。说“运动的钟会改变快慢”，这是什么意思呢？为简单起见，假定上面的坐标系只有一个钟，下面的坐标系则有许多个钟。所有钟的构造都相同，下面几个钟是同步的，亦即同时指示相同的时刻。在下面三幅图中，我们画出了作相对运动的两个坐标系的三个相继位置。在第一幅图中，我们约定上下几个钟的指针指向相同的位置。在第二幅图中我们看到，一段时间以后，两个坐标系有了相对位置。在下面的坐标系中，所有钟都指示着相同的时刻，而在上面的坐标系中，钟的快慢却改变了。之所以有这种快慢改变和时间差异，是因为这个钟正在相对于下面的坐标系运动。在第三幅图中，我们看到指针位置的差异随时间而增大了。

静止在下面坐标系中的观察者会发现，运动的钟改变了快慢。如果这个钟相对于上面坐标系中静止的观察者而运动，当然也会发现同样的结果；在这种情况下，上面的坐标系中必须有许多个钟，而下面的坐标系中则只要一个。在两个作相对运动的坐标系中，自然定律必定是相同的。

在经典力学中，我们默认运动的钟不会改变快慢。这似乎太过明显，几乎不值得提及。但如果真想认真，没有任何东西是太过明显的，我们应当对物理学中一直被视为理所当然的假设进行分析。

不能因为某个假设只是跟经典物理学的假设不同就认为它是不合理的。我们完全可以设想运动的钟会改变快慢，只要这种变化定律对于所有惯性系都相同。

再举一例。取一根米尺，这意味着只要它静止在某个坐标系中，它的长度就是1米。现在它作匀速直线运动，沿着代表坐标系的量杆滑动。它的长度看起来还是1米吗？我们必须预先知道如何确定它的长度。只要米尺静止，它的两端就会与坐标系上相隔1米的两个刻度重合。由此我们断定，静止米尺的长度是1米。而当这根尺子运动时，我们如何来测量它的长度呢？可以这样做：两位观察者在某一时刻同时拍快照，一个人拍运动尺子的始端，另一个人拍它的末端。由于照片是同时拍的，我们可以通过比较运动尺子的始端和末端与坐标系量杆重合的那两个刻度来确定它的长度。必须有两位观察者来留意在该坐标系的不同位置同时发生的事件。没有任何理由认为这样的测量结果会与米尺静止时相同。既然照片必须同时拍，而我们知道，“同时”是一个与坐标系有关的相对概念，因此在彼此作相对运动的不同坐标系中，这种测量似乎很可能会得出不同的结果。

我们完全可以设想，如果变化定律对于所有惯性坐标系都相同，那么不仅运动的钟会改变快慢，运动的尺子也会改变长度。

到目前为止，我们只讨论了一些新的可能性，而没有为认定这些可能性给出任何理由。

我们还记得，在所有惯性坐标系中光速都相同。这一事实与经典变换是无法调和的。这个结必须在某处打破，难道不能在这里吗？我们难道不能假定运动钟的快慢和运动量杆的长度会发生改变，以致由这些假定可以直接推出光速不变吗？的确可以！这就是相对论彻底不同于经典物理学的第一个实例。我们的论证可以颠倒过来：如果光速在所有坐标系中都相同，那么运动的量杆必须改变长度，运动的钟也必须改变快慢，这些变化所遵从的定律是严格确定的。

所有这些并没有什么神秘或不合理的地方。在经典物理学中，我们总是假定运动的钟和静止的钟有相同的快慢，运动量杆和静止量杆有相同的长度。如果光速在所有坐标系中都相同，如果相对论是有效的，我们就必须牺牲掉这个假设。这些根深蒂固的偏见很难去除，但我们别无他法。从相对论的观点来看，旧概念显得很武断。为什么要相信对于所有坐标系中的所有观察者，绝对时间都以同样的方式流逝呢？为什么要相信距离不可改变呢？时间由钟来测定，空间坐标由量杆来测定，测定结果也许会依赖于这些钟和量杆在运动时的行为。没有理由认为它们会按照我们希望的方式来行为。经由电磁场现象，观测结果间接地表明，运动的钟会改变快慢，运动的量杆会改变长度，而根据力学现象，我们想不到会有这种事情发生。在每一个坐标系中我们都必须接受相对时间的概念，因为这是解决困难的最佳出路。从相对论中发展出来的进一步的科学进展表明，不应把这个新观点看成“必然的恶”（malumnecessarium），因为它的功绩太过显著。

迄今为止，我们一直在试图说明是什么东西让我们作出了相对论的基本假设，以及相对论如何迫使我们修改经典变换，以新的方式来处理时间和空间。我们的目标是指出新物理哲学观的那些基本观念。这些观念都很简单，但以这里表述的形式还不足以得出任何定性或定量的结论。我们必须重新启用那种老办法，即只解释主要观念，对于其他一些观念则只作陈述而不给出证明。

为了说清楚相信经典变换的旧物理学家（下面称之为“古”）与懂得相对论的现代物理学家（下面称之为“今”）在观点上的区别，设想他们作了以下对话：

古：我相信力学中的伽利略相对性原理，因为我知道在两个相对作匀速直线运动的坐标系中，力学定律是相同的。或者换句话说，这些定律对于经典变换是不变的。

今：但相对性原理必须适用于我们外界的所有事件。在相对作匀速直线运动的坐标系中，不仅力学定律必须相同，所有自然定律都必须相同。

古：但是在相对运动的坐标系中，怎么可能所有自然定律都相同呢？场方程即麦克斯韦方程对于经典变换并不是不变的。光速的例子清楚地表明了这一点。根据经典变换，这个速度在两个相对运动的坐标系中不应相同。

今：这只表明经典变换是不适用的，两个坐标系之间的关联必须有所不同；我们也许不能依照这些变换定律把不同坐标系中的坐标和速度联系起来，而是必须代之以新的定律，从相对论的基本假设中将其推导出来。我们暂不去管这种新变换定律的数学表述，只要知道它与经典变换不同就够了。我们将它简称为洛伦兹变换。可以证明，麦克斯韦方程即场定律对于洛伦兹变换是不变的，就像力学定律对于经典变换是不变的一样。让我们回忆一下经典物理学中的情形。坐标有坐标的变换定律，速度有速度的变换定律，但两个相对作匀速直线运动的坐标系中的力学定律却是相同的。我们有空间的变换定律，却没有时间的变换定律，因为时间在所有坐标系中都相同。而在相对论中却不同了，空间、时间和速度都有跟经典变换不同的变换定律。但同样，自然定律在所有相对作匀速直线运动的坐标系中都必须相同。自然定律必须是不变的，但不是像前面那样对于经典变换不变，而是对于一种新的变换即所谓的洛伦兹变换不变。在所有的惯性坐标系中，自然定律都是有效的，从一个坐标系到另一个坐标系的过渡是由洛伦兹变换给出的。

古：我相信你的话，但我很想知道经典变换与洛伦兹变换的差别。

今：你的问题最好通过以下方式来回答。你且说出经典变换的一些典型特征，我试着解释一下它们是否已经保存在洛伦兹变换中，如果没有，我再解释它们如何发生了改变。

古：假定我的坐标系中有某个事件发生在某一点、某一时刻，那么相对于我的坐标系作匀速直线运动的另一个坐标系中的观察者会为这个事件的发生位置指定不同的数，但时间当然是相同的。我们在所有坐标系中都使用同一个钟，钟是否运动无关紧要。在你看来也是这样吗？

今：不，不是这样的。每一个坐标系都必须配备它自己静止的钟，因为运动会改变钟的快慢。两个不同坐标系中的两位观察者不仅会为位置指定不同的数，而且会为这个事件发生的时刻指定不同的数。

古：这意味着时间不再是不变量。在经典变换中，所有坐标系中的时间都相同。而在洛伦兹变换中则并非如此，时间变得和经典变换中的坐标有点相似。我想知道，长度的情况是怎样的？根据经典力学的看法，刚性量杆无论静止还是运动都不会改变长度。现在还是如此吗？

今：不是了。事实上，根据洛伦兹变换，运动的量杆会沿运动方向收缩，如果速度增加，收缩也会增加。量杆运动得越快，看起来就越短。但这种收缩只发生在运动方向上。在下图中我们可以看到，一根量杆在运动速度接近光速的90％时，其长度会收缩到原来的一半，但在垂直于运动的方向上却没有收缩。

古：这意味着运动钟的快慢和运动量杆的长度都与速度有关，但关系是什么呢？

今：随着速度的增加，改变愈发明显。根据洛伦兹变换，一根尺子的速度若是达到光速，其长度会收缩为零。同样，与它沿着量杆经过的各个钟相比，运动的钟会渐渐慢下来，倘若以光速运动，它就会停住。

古：这似乎与我们所有的经验都不相符。我们知道，汽车运动时并不会变短。我们也知道，汽车司机可以把他的“好”钟与沿途经过的各个钟加以比较，发现它们总是很一致。这与你的说法相反。

今：这当然是对的，但这些力学速度都远远小于光速，因此把相对论用于这些现象是荒谬的。每一个汽车司机即使把速度增加几十万倍，也能放心地使用经典物理学。只有在速度接近光速时，才能期望实验结果与经典变换之间有不一致。只有在速度很大时才能检验洛伦兹变换的有效性。

古：但还有另一个困难。根据力学，我可以想象物体的速度甚至大于光速。一个物体如果相对于漂浮的船以光速运动，则它相对于岸的速度就应比光速更大。一根尺子的速度若是等于光速，其长度会收缩为零，那么当它的速度大于光速时会出现什么情况呢？我们无法期望有一种负的长度。

今：你实在没有理由作这样的讽刺！根据相对论的观点，物体的速度不可能大于光速，光速构成了所有物体速度的上限。倘若一个物体相对于船的速度等于光速，那么它相对于岸的速度也等于光速。加减速度的简单力学定律不再有效，或者更确切地说，对于小的速度近似有效，对于接近光速的速度则不再有效。表示光速的数明确出现在洛伦兹变换中，和经典力学中的无限大速度一样扮演着极限情形的角色。这个更一般的理论与经典变换和经典力学并不矛盾。恰恰相反，当速度很小时，作为极限情形，我们又得到了旧概念。从新理论的观点可以看得很清楚，经典物理学在哪些情况下有效，它的极限在哪里。把相对论用于汽车、轮船和火车的运动，就像把计算机用于只用乘法表便可解决的问题一样可笑。

8.相对论与力学

相对论产生于迫切需要，产生于旧理论中似乎无法摆脱的严重而深刻的矛盾。新理论的长处在于解决所有这些困难时非常一致和简单，只用了很少几条令人信服的假设。

虽然这种理论源于场的问题，但它必须包含所有物理定律。这里似乎有一个困难。场的定律和力学定律属于完全不同的类型。电磁场方程对于洛伦兹变换是不变的，力学方程对于经典变换是不变的。但相对论声称，所有自然定律都必须对于洛伦兹变换不变，而不是对于经典变换不变。经典变换仅仅是两个坐标系的相对速度很小时洛伦兹变换的一个特殊的极限情况。如果是这样，就必须改变经典力学，以满足对于洛伦兹变换的不变性要求。或者换句话说，速度接近光速时，经典力学就不再有效了。从一个坐标系过渡到另一个坐标系只有一种变换，那就是洛伦兹变换。

我们只需把经典力学加以改造，使之既不违反相对论，又不违反经典力学所解释的大量观测材料。旧力学适用于小速度，是新力学的极限情况。

我们不妨考虑相对论使经典力学发生改变的一个实例，也许能够引出某些可用实验加以证明或否证的结论。

假定某个具有一定质量的物体在沿直线运动，一个外力沿着它的运动方向作用于它。我们知道，力正比于速度的变化。或者说得更明确些，某个物体在1秒钟内速度是从100英尺每秒增加到101英尺每秒，或者从100英里每秒增加到（100英里＋1英尺）每秒，还是从180000英里每秒增加到（180000英里＋1英尺）每秒，都是无关紧要的。只要一个物体在相同时间内获得相同的速度改变，作用于该物体的力就总是相同的。

这句话从相对论的观点来看对吗？不对！这条定律只对小速度有效。根据相对论，接近光速的大速度的定律是怎样的呢？如果速度很大，再要增加速度就需要极大的力。把100英尺每秒的速度增加1英尺每秒和把接近光速的速度增加1英尺每秒根本不可同日而语。速度越接近光速，增加它就越难。速度等于光速时，就不可能再增加了。因此，相对论所引起的这些改变是不足为奇的。光速是所有速度的上限。一个有限的力，无论多么大，都不能使速度增加到超过这个极限。一种更复杂的力学定律出现了，它取代了联系力与速度变化的旧力学定律。从我们的新观点来看，经典力学很简单，因为几乎在所有观察中，我们处理的速度都远小于光速。

静止的物体具有一定的质量，被称为静止质量。力学告诉我们，任何物体都会抵抗其运动的变化；质量越大，抵抗越大，质量越小，抵抗也越小。但在相对论中却不仅如此。不仅静止质量越大，物体对运动变化的抵抗就越大，而且速度越大，抵抗也越大。在经典力学中，既定物体的抵抗是不变的，仅由物体的质量来刻画。而在相对论中，它既与静止质量有关，也与速度有关。当速度接近光速时，抵抗就成为无限大。

刚才引述的结果使我们能用实验来检验这个理论。速度接近光速的抛射体对外力作用的抵抗会符合理论预测吗？由于相对论在这方面的陈述具有定量性，所以倘若速度接近光速的抛射体能够实现，我们就能证明或否证这个理论。

我们在自然之中的确可以找到具有这种速度的抛射体。放射性物质的原子，比如镭原子，能像大炮一样发射速度极高的炮弹。我们不去深入细节，只引用现代物理学和化学中一个非常重要的观点。宇宙万物都是由少数几种基本粒子构成的，就像一座城市中有尺寸不一、结构不同和建筑各异的房屋，但无论是简陋的棚子还是摩天大楼，都是用少数几种砖块建成的。同样，我们物质世界中所有已知的化学元素，从最轻的氢到最重的铀，都是由同样几种基本粒子构成的。最重的元素或最复杂的建筑是不稳定的，它们会衰变，或者说具有放射性。构成放射性原子的某些基本粒子有时会以接近光速的速度被抛射出来。根据现在已被大量实验确证的看法，元素的原子（比如镭原子）结构非常复杂，放射性衰变等诸多现象表明，原子是由更加简单的砖块即基本粒子所构成的。

通过巧妙而复杂的实验，我们可以查明粒子是如何抵抗外力作用的。实验表明，这些粒子的抵抗与速度有关，这正是相对论所预言的。在可以表明抵抗与速度有关的其他许多事例中，理论与实验也完全一致。我们再次看到了创造性科学工作的本质特征：理论预言某些事实，然后实验加以确证。

这个结果暗示着另一个重要推广。静止物体有质量，但没有动能（即运动的能量）。运动物体既有质量又有动能。它比静止物体更强烈地抵抗速度的改变，运动物体的动能就好像增加了它的抵抗似的。如果两个物体有相同的静止质量，则动能较大的物体对外力作用的抵抗较强。

设想有一个装着许多球的箱子，箱子和球在我们的坐标系中都是静止的。要使箱子运动，增加它的速度，需要某个力。但如果各个球在箱子里像气体分子一样以接近光速的平均速度朝各个方向运动，那么同样的力在相同时间内能否使速度增加相同的量呢？由于球增加的动能加强了箱子的抵抗，所以现在需要更大的力。能量，至少是动能，会像有重量的质量一样抵抗运动。那么，一切种类的能量都是如此吗？

对于这个问题，相对论由自己的基本假设给出了一个清晰而令人信服的回答，而且是定量性的：所有能量都会抵抗运动的改变；所有能量都像物质一样行为；炽热的铁块要比冰冷时更重；太阳发出的穿过空间的辐射包含能量，因此也有质量；太阳和所有辐射星体都因为发出辐射而损失质量。这个非常一般的结论是相对论的一项重要成就，与检验它的所有事实都符合。

经典物理学引入了两种实体，即物质和能量。物质有重量，能量没有重量。经典物理学中有两个守恒定律，一个是物质守恒，另一个是能量守恒。我们曾经追问，现代物理学是否仍然秉持着这种对两种实体和两个守恒定律的看法。回答是：“否”。根据相对论，质量与能量之间没有本质区别。能量有质量，质量代表能量。我们现在不是有两个而是只有一个守恒定律，即质量-能量守恒。事实证明，这种新观点在物理学的进一步发展中非常成功，富有成效。

能量有质量，质量代表能量，人们为什么一直没有发现这个事实呢？热铁块要比冷铁块更重吗？现在对这个问题的回答是“是”，而过去（见“热是实体吗”一节）则是“否”。其间的内容肯定还不足以讲清楚这个矛盾。

我们这里遇到的困难与前面遇到的是同一种类型。相对论预言的质量变化小到无法测量，哪怕最灵敏的天平也无法直接检测出来。有很多令人信服但间接的方式可以证明能量有重量。

之所以缺乏直接证据，是因为物质与能量之间的兑换率太小。能量之于质量，就如同贬值货币之于高值货币。为了说清楚这一点，让我们举一个例子。能把3万吨水变成蒸汽的热量称起来大约只有1克重。之所以一直认为能量没有重量，仅仅是因为它所代表的质量太小了。

旧的能量-实体是相对论的第二个牺牲品，第一个牺牲品是传播光波的介质。

相对论的影响远远超出了产生相对论的那个问题。它消除了场论的困难和矛盾，提出了更一般的力学定律，用一个守恒定律取代了两个守恒定律，改变了我们经典的绝对时间概念。其有效性并不限于物理学领域，它所形成的一般框架包含一切自然现象。

9.时-空连续区

“1789年7月14日，法国大革命开始于巴黎”。这句话陈述了一个事件的地点和时间。如果一个人初次听到这句话，并且不懂“巴黎”是什么意思，你可以告诉他：这是我们地球上的一座城市，位于北纬49度东经2度。于是，这两个数刻画了事件发生的地点，“1789年7月14日”则刻画了事件发生的时间。在物理学中，精确刻画事件发生的地点和时间远比在历史学中更重要，因为这些数据是定量描述的基础。

为简单起见，我们前面只考虑了直线运动。我们的坐标系是一根有原点无终点的刚性量杆，这一限制我们还保留。在量杆上取不同的点，其位置只能用一个数即该点的坐标来刻画。说一个点的坐标是7.586英尺，意思是它与量杆原点的距离为7.586英尺。反过来，如果有人给我任何一个数和一个单位，我总能在量杆上找到一个点与这个数对应。可以说，量杆上任何一个明确的点都与一个数对应，任何一个数都与量杆上一个明确的点对应。数学家将这个事实表述为：量杆上所有的点构成了一个一维连续区。距离量杆上每一个点任意近的地方都有一个点。我们可以用任意小的步距将量杆上两个相距遥远的点连接起来。将相距遥远的两点连接起来的步距可以任意小，这就是连续区的典型特征。

还有一例。假定有一个平面，或者你如果喜欢，假定它是一个长方形桌面。桌面上某一点的位置可以用两个数来刻画，而不像前面那样只用一个数来刻画。这两个数就是该点与桌面两条垂直边的距离。平面上每一点对应于两个数而不是一个数，任何两个数都有一个确定的点跟它对应。换句话说，平面是一个二维连续区。与平面上每一点距离任意近的地方都有别的点。可以用分成任意小步距的一条曲线将两个相距遥远的点连接起来。将相距遥远的两点连接起来的步距可以任意小，每一点都可以用两个数来表示，这就是二维连续区的典型特征。

再举一个例子。假定你要把自己的房间看成你的坐标系，也就是说，你想借助于房间的墙来描述所有位置。如果一盏灯是静止的，那么这盏灯的位置可以用三个数来描述：其中两个数决定它与两个垂直墙面的距离，第三个数决定它与天花板或地板的距离。空间中每一点都对应于三个确定的数，任何三个数都对应于空间中某个确定的点。用一句话来说就是：我们的空间是一个三维连续区。与空间中每一点距离任意近的地方都有别的点。将相距遥远的两点连接起来的步距可以任意小，每一点都可以用三个数来表示，这就是三维连续区的典型特征。

但以上所谈还不是物理学。现在回到物理学，我们必须考察物质粒子的运动。要想观察和预言自然之中的事件，不仅要考虑物理事件的位置，还要考虑它发生的时间。我们再举一个非常简单的例子。

假定一个小石头（可以看成一个粒子）从256英尺高的塔上落下来。自伽利略的时代起，我们就能预言石头开始下落后在任何时刻的坐标。以下是描述石头在0、1、2、3、4秒后所在位置的“时间表”。

我们的“时间表”中记录着五个事件，每一个事件都用两个数即它的时间和空间坐标来表示。第一个事件是石头在0秒时从距地面256英尺处下落。第二个事件是石头经过我们的刚性量杆（塔）距地面240英尺处，这发生在下落1秒之后。最后的事件是石头碰到地面。

我们可以用另一种方式来表示从这张“时间表”中得到的知识，比如可以把“时间表”中的五对数字表示成平面上的五个点。我们先来确定比例尺。如图所示，一个线段表示100英尺，另一个线段表示1秒。

然后画两条垂直的线，称水平线为时间轴，称竖直线为空间轴。我们立刻发现，我们的“时间表”可以用时-空平面中的五个点来表示。

点与空间轴的距离代表“时间表”第一列中记录的时间坐标，与时间轴的距离则代表空间坐标。

“时间表”和平面上的点，方式虽然不同，表达的事物却完全一样。每一种方式都可以由另一种方式构造出来。这两种方式中选择哪一种取决于人的爱好，因为它们其实是等价的。

现在我们再前进一步。假定有一张更好的“时间表”，它给出的不是每1秒的位置，而是每1/100秒或1/1000秒的位置。这样一来，我们的时-空平面上就会有很多点。最后，如果对每一时刻都给出位置，或如数学家所说，把空间坐标表示成时间的函数，这些点就成了一条连续的线。于是，下图描绘的并非以前那种知识片段，而是关于运动的全部知识。

沿着刚性量杆（塔）的运动，也就是一维空间中的运动，在这里表示为二维时-空连续区中的一条曲线。我们时-空连续区中的每一点都对应于两个数，一个是时间坐标，另一个是空间坐标。反过来，对事件进行刻画的任意两个数都对应于我们时-空连续区中的某个点。相邻的两个点代表在略为不同的时间和位置发生的两个事件。

你或许会这样来反对我们的图示：用线段来代表时间单位，将它机械地与空间结合在一起，两个一维连续区结合成一个二维连续区，这是毫无意义的。但这样一来，你就必须同样强烈地反对许多图示，比如表示去年夏天纽约温度变化的图，表示近年来生活费用变化的图，等等，因为这些例子使用的都是同样的方法。在温度图中，一维的温度连续区与一维的时间连续区结合成二维的温度－时间连续区。

让我们回到从256英尺高塔上落下的粒子。我们对运动的常用图示刻画了粒子在任一时刻的位置。知道了粒子是如何运动的，我们就能再次把它的运动画下来。这有两种方式。

我们还记得粒子在一维空间中位置随时间变化的图，运动被看成一维连续区中发生的一系列事件。我们并未把时间和空间混在一起，而是使用了位置随时间变化的动态图。

但我们也可以用另一种方式来画同一运动，把它看成二维时-空连续区中的曲线，构成一张静态图。现在运动被画成了二维时-空连续区中的某种东西，而不是某种在一维空间连续区中变化的东西。

这两种图完全等价，偏爱哪一种取决于人的习惯和爱好。

关于运动的这两种图示，这里所说的一切都与相对论无关。两种图示可以平等地使用，不过经典物理学更偏爱动态图，把运动描绘成空间中发生的事件，而不是存在于时-空中的东西。但相对论改变了这种看法。它明确支持静态图，发现把运动表示成时-空中的某种东西，更加客观和方便地描绘了实在。我们还要回答一个问题：为什么这两种图从经典物理学的观点来看是等价的，而从相对论的观点来看却不等价呢？

要想知道这个问题的答案，需要重新考虑相对作匀速直线运动的两个坐标系。

根据经典物理学，两个相对作匀速直线运动的坐标系中的观察者将为同一个事件指定不同的空间坐标和相同的时间坐标。所以在上述例子中，在我们选定的坐标系中，石头碰到地面是用时间坐标“4”和空间坐标“0”来刻画的。根据经典力学，相对于我们的坐标系作匀速直线运动的观察者也会认为石头在4秒之后到达地面。但这位观察者会把距离与他的坐标系相参照，而且一般来说会把不同的空间坐标与石头碰到地面这件事联系起来，尽管对于他和所有其他相对作匀速直线运动的观察者来说，时间坐标都相同。经典物理学只知道，对于所有观察者来说，有一个“绝对”时间在流动。对于每一个坐标系，都可以把二维连续区分成两个一维连续区：时间与空间。由于时间是“绝对的”，所以在经典物理学中，从运动的“静态”图到“动态”图的过渡就有了一种客观意义。

但是我们已经确信，不能把经典变换普遍用于物理学。从实用的角度来看，对于小速度来说它还可以用，但不能用来解决基本的物理问题。

根据相对论，石头碰到地面的时间不会在所有观察者看来都一样。在两个不同的坐标系中，时间坐标和空间坐标都会不同。倘若相对速度接近光速，时间坐标的变化将会非常明显。我们不能像在经典物理学中那样把二维连续区分解成两个一维连续区。在确定另一个坐标系中的时-空坐标时，我们绝不能把空间和时间分开来考虑。从相对论的观点来看，把二维连续区分解成两个一维连续区似乎是一种没有客观意义的武断做法。

不难把我们刚才讲的一切推广到非直线运动的情况。事实上，描述自然之中的事件需要用四个数而不是两个数。通过物体及其运动来构想的我们的物理空间有三个维度，位置由三个数来刻画。事件的时刻是第四个数。每一个事件都对应于四个确定的数，任何四个数都对应于一个确定的事件。于是，事件世界就成了一个四维连续区。这一点并无神秘之处，这句话对于经典物理学和相对论都是同样正确的。但是当我们考察两个相对作匀速直线运动的坐标系时又会发现差异。假定房间在运动，屋内屋外的观察者要确定同一个事件的时-空坐标。经典物理学家们会把这个四维连续区分解成三维空间和一维时间连续区。旧物理学家只关心空间变换，因为对他来说，时间是绝对的。他认为把四维世界连续区分解成空间和时间是方便而自然的。但是从相对论的观点来看，从一个坐标系过渡到另一个坐标系时，时间和空间都会改变。洛伦兹变换考察的正是我们四维事件世界的四维时-空连续区的变换性质。

事件世界可以用一幅投射到三维空间背景上的随时间变化的动态图来描述，但也可以用一幅投射到四维时－空连续区背景上的静态图来描述。从经典物理学的观点来看，这一动一静的两幅图是等价的。不过从相对论的观点来看，静态图要更方便、更客观。

如果愿意，即使在相对论中我们也仍然可以使用动态图。但我们必须记住，这种对时间和空间的划分并无客观意义，因为时间不再是“绝对”的。接下来我们仍然会用“动态”而非“静态”的语言，请记住它的局限性。

10.广义相对论

还有一点需要澄清。有一个最基本的问题尚未解决：惯性系存在吗？对于自然定律，自然定律对洛伦兹变换的不变性，以及它们在相对作匀速直线运动的所有惯性系中的有效性，我们已经有所了解。我们有了定律，但不知道它们属于哪个参照系。

为了把这个问题看得更清楚，我们采访一位经典物理学家，向他提出几个简单的问题：

“什么是惯性系？”

“是力学定律在其中有效的坐标系。在这样一个坐标系中，不受外力作用的物体总是作匀速直线运动。凭借这个性质，我们可以把惯性坐标系和其他坐标系区分开来。”

“但是说‘没有力作用于物体上’，这话是什么意思呢？”

“这只是说物体在惯性坐标系中作匀速直线运动。”

这里我们可以再问一次：“什么是惯性坐标系？”但由于得到与前面不同的回答希望渺茫，我们不妨把问题改变一下，看看能否得到一些具体的信息。

“与地球刚性连接的坐标系是惯性坐标系吗？”

“不是，因为由于地球的转动，力学定律在地球上并非严格有效。在许多问题上，我们可以把与太阳刚性连接的坐标系看成一个惯性坐标系，但在谈论太阳的转动时，同样不能把一个与太阳刚性连接的坐标系看成惯性坐标系。”

“那么你所说的惯性坐标系究竟是什么呢？它的运动状态如何选择？”

“它只是一个有用的虚构，我不知道如何实现它。倘若我能远离所有物体，并且不受任何外界影响，我的坐标系就是惯性的。”

“但你所说的不受任何外界影响的坐标系是什么意思呢？”

“我的意思是那个坐标系是惯性的。”

于是我们又回到了最初那个问题！

我们的采访揭示了经典物理学中的一个严重困难。我们有定律，但不知道它们属于哪一个参照系，我们的整座物理学大厦似乎都建在沙子上。

我们可以从另一种观点来考察这个困难。想象在整个宇宙中只有一个物体，它成了我们的坐标系。这个物体开始转动。根据经典力学，转动物体的物理定律不同于不转动物体的物理定律。惯性原理若在一种情况下有效，在另一种情况下就无效了。但这听起来很让人怀疑。倘若整个宇宙中只有一个物体，我们可能考察它的运动吗？所谓物体的运动，我们总是指它相对于另一个物体的位置改变。因此，谈论唯一一个物体的运动是违反常识的。在这一点上，经典物理学与常识严重不一致。牛顿的说法是：如果惯性定律有效，那么这个坐标系要么静止，要么作匀速直线运动。如果惯性定律无效，那么物体作的是非匀速运动。因此，我们对运动或静止的判断依赖于是否所有物理定律都适用于某个给定的坐标系。

取两个物体，比如太阳和地球。我们观察到的运动同样是相对的。为了描述它，我们既可以把坐标系与地球相连，也可以与太阳相连。从这个观点来看，哥白尼的伟大成就在于把坐标系从地球转到了太阳。但由于运动是相对的，任何参照系都可以用，所以似乎没有理由更偏爱某个坐标系。

物理学再次干涉和改变了我们的常识观点。与太阳相连的坐标系比与地球相连的坐标系更像惯性系，物理定律应当适用于哥白尼的坐标系而不是托勒密的坐标系。只有从物理学的观点出发才能认识到哥白尼的发现有多么伟大。它表明，使用与太阳刚性连接的坐标系来描述行星的运动有莫大的好处。

在经典物理学中，绝对的匀速直线运动并不存在。如果两个坐标系相对作匀速直线运动，那么说“这个坐标系静止，那个坐标系运动”是没有意义的。但如果两个坐标系相对作非匀速直线运动，那么就完全有理由说：“这个物体运动，那个物体静止（或匀速直线运动）。”绝对运动在这里有着非常明确的意义。在这一点上，常识与经典物理学之间有一条宽阔的鸿沟。刚才提到的惯性系的困难与绝对运动的困难是密切相关的。正是因为有了自然定律在其中有效的惯性系的观念，绝对运动才是可能的。

这些困难似乎是无法避免的，就好像任何物理理论都无法避免它们一样。其根源在于，自然定律只对惯性系这一种特殊的坐标系才有效。这个困难能否解决，取决于如何回答以下问题。我们表达的物理定律能否对所有坐标系都有效，亦即不仅对相对作匀速直线运动的坐标系有效，而且对相对作任何运动的坐标系也有效呢？如果可以做到，我们的困难也就解决了。那样一来，我们就可以把自然定律应用于任何一个坐标系，以前托勒密与哥白尼观点之间的激烈斗争也就变得没有意义了。对每一个坐标系的使用都是平权的。“太阳静止，地球运动”或“太阳运动，地球静止”这两句话仅仅是涉及两个不同坐标系的两种不同约定而已。

我们能否建立一种在所有坐标系中都有效的真正的相对论物理学呢？或者说，能否建立一种只有相对运动而没有绝对运动的物理学呢？这的确是可能的！

关于如何建立这种新物理学，我们至少已经有一条线索，尽管这条线索非常弱。真正的相对论物理学必须适用于一切坐标系，因此也适用于惯性坐标系这个特例。我们已经知道适用于这个惯性坐标系的一些定律。在惯性系的特例中，对一切坐标系有效的新的一般定律必须归于旧的已知定律。

为一切坐标系提出物理定律的问题已经被所谓的广义相对论解决了。前面所讲的理论被称为狭义相对论，只适用于惯性系。当然，这两种理论不能彼此矛盾，因为我们必须总是把旧的狭义相对论定律纳入一个惯性系的一般定律。但是，正因为以前物理定律仅仅是针对惯性坐标系而提出的，所以现在惯性坐标系将成为特殊的极限情形，因为在广义相对论中，一切相对作任意运动的坐标系都是允许的。

这就是广义相对论的纲领。但要概述这个纲领是如何实施的，我们必须说得比以前更模糊些。科学发展过程中产生的新困难迫使我们的理论变得越来越抽象。异乎寻常的意外经历仍然在等待着我们。但我们的最终目标永远是更好地理解实在。联系理论与观察的逻辑链条又增加了新的环节。为把理论到实验的道路上不必要的人为假设清除掉，使理论涵盖越来越广的事实，就必须使这个链条越来越长。我们的假设变得越简单、越基本，数学推理工具越复杂，从理论到观察的道路就越长、越复杂、越难以描述。虽然听起来很悖谬，但我们依然可以说：新物理学比旧物理学更简单，因此也似乎更困难、更复杂。我们关于外在世界的图像越简单，包含的事实越多，就越能在我们的心灵中反映出宇宙的和谐。

我们的新观念很简单：建立一种对于所有坐标系都有效的物理学。这种观念的实现使形式变得更加复杂，我们不得不使用一些物理学尚未用过的数学工具。这里我们只阐述这个纲领的实现与两个主要问题（引力和几何学）的关系。

11.升降机内外

惯性定律标志着物理学中的第一项伟大进展，事实上是物理学的真正开端。它是通过思索一个理想实验而得到的，即一个物体在既无摩擦又无任何外力作用的情况下永远运动下去。从这个例子以及后来许多其他例子中，我们认识到由思想创造的理想实验的重要性。这里同样要讨论理想实验。这些理想实验听起来也许很荒唐，却能像简单方法一样帮助我们理解相对论。

前面讲过作匀速直线运动的房间的理想实验。这里我们要讲一个下落升降机的理想实验。

想象有一个大升降机位于摩天大楼的楼顶，这座摩天大楼比任何实际的摩天大楼都要高得多。突然，升降机的钢缆断了，于是升降机朝着地面自由下落。下落过程中，升降机里的观察者正在做实验。描述这些实验的时候，我们不必考虑空气的阻力或摩擦力，因为在理想条件下可以不考虑它们的存在。一位观察者从口袋里拿出一块手帕和一块表，然后丢开它们。这两个物体会怎样呢？正在从升降机的窗户外面朝里望的观察者会发现，手帕和表都以同样的加速度落向地面。我们还记得，落体的加速度与它的质量无关，正是这个事实揭示了引力质量与惯性质量的相等。我们也记得，从经典力学观点来看，引力质量与惯性质量的相等是完全偶然的，在经典力学的结构中不起任何作用。然而在这里，从所有落体都有相同的加速度这一事实中反映出来的两种质量的相等是至关重要的，它构成了我们全部论证的基础。

让我们回到那块下落的手帕和表。在升降机外面的观察者看来，这两个物体都以同样的加速度下落。但升降机连同它的四壁、天花板和地板也都以同样的加速度下落，因此两个物体与地板之间的距离并不改变。而在升降机里面的观察者看来，这两个物体一直停在松手丢开它们的那个地方。里面的观察者可以不考虑引力场，因为场源在他的坐标系外面。他发现升降机内部没有任何力作用于这两个物体，因此它们是静止的，就像在一个惯性坐标系中似的。奇怪的事情在升降机中发生了！如果这位观察者朝任何方向（比如朝上或朝下）推动一个物体，那么只要没有碰到升降机的天花板或地板，这个物体将一直作匀速直线运动。简而言之，对于升降机里面的观察者来说，经典力学的定律是有效的。所有物体都按照惯性定律来运动。这个与自由下落的升降机刚性连接的新坐标系只在一个方面不同于惯性坐标系。在惯性坐标系中，不受任何力作用的运动物体会永远作匀速直线运动。经典物理学中描述的惯性坐标系在空间和时间上都没有限制。而我们升降机中的观察者的情形就不同了，其坐标系的惯性性质在空间和时间上都有限制。这个匀速直线运动的物体迟早会碰到升降机的壁，从而破坏匀速直线运动。整个升降机也迟早会撞到地面，从而破坏里面的观察者及其实验。这个坐标系仅仅是实际惯性坐标系的“袖珍版”罢了。

坐标系的这种局域性很重要。如果想象升降机一端在北极，一端在赤道，而手帕放在北极，表放在赤道，那么在外面的观察者看来，这两个物体不会有相同的加速度，也不会相对于彼此静止。我们的整个论证就失败了！升降机的体积必须有一定的限制，这样才能认为在升降机外面的观察者看来所有物体的加速度都相等。

有了这种限制，这个坐标系在里面的观察者看来就有了一种惯性。我们至少可以指出一个所有物理定律在其中都有效的坐标系，尽管它在时间和空间上受到了限制。如果设想另一个坐标系，即相对这个自由下落的升降机作匀速直线运动的升降机，那么这两个坐标系都将是局域惯性的。在这两个坐标系中，所有定律都完全相同。从一个坐标系到另一个坐标系的过渡由洛伦兹变换给出。

让我们看看升降机内外的两位观察者用什么方式来描述升降机中发生的事情。

外面的观察者注意到了升降机及其内部所有物体的运动，发现它们符合牛顿的引力定律。在他看来，由于地球引力场的作用，此运动不是匀速的，而是加速的。

然而，在升降机内出生和长大的一代物理学家却有完全不同的推理。他们相信自己拥有一个惯性系，会把所有自然定律都与他们的升降机相参照，并且自信地说，在他们的坐标系中，定律都有一种特别简单的形式。他们会自然认为自己的升降机是静止的，其坐标系是惯性的。

升降机内外观察者的分歧是不可能化解的。他们都有权把所有事件与自己的坐标系相参照，两者对事件的描述都能自圆其说。

由这个例子我们可以看到，即使两个坐标系相对于彼此不作匀速直线运动，对其中的物理现象作出一致的描述也是可能的。但要作这样的描述，必须考虑引力，这是从一个坐标系过渡到另一个坐标系的“桥梁”。外面的观察者认为引力场存在，里面的观察者却认为不存在。外面的观察者认为存在着升降机在引力场中的加速运动，里面的观察者却认为升降机是静止的，引力场不存在。然而，使两个坐标系中的描述成为可能的引力场——这座“桥梁”——有一个非常重要的支柱，那就是引力质量等于惯性质量。倘若没有经典力学未曾注意的这条线索，我们现在的论证就会完全失败。

现在再讲一个略为不同的理想实验。假定有一个惯性坐标系，惯性定律在其中是有效的。我们已经描述过静止于这样一个惯性坐标系的升降机中发生的事情。现在把图像改变一下，假定有人在升降机外面把一根绳索固定在升降机上，并以恒定的力沿着如图所示的方向牵拉。至于如何做到这些是无关重要的。既然力学定律在这个坐标系中有效，整个升降机将以恒定的加速度沿着运动的方向运动。我们再来听听升降机内外的观察者是如何解释升降机中的现象的。

外面的观察者：我的坐标系是一个惯性坐标系。升降机以恒定的加速度运动，这是因为有一个恒定的力在起作用。里面的观察者在作绝对运动，力学定律对他是无效的。他看不出不受力作用的物体是静止的。如果释放一个物体，它很快就会碰在升降机的地板，因为地板在朝着这个物体向上运动。表和手帕也是如此。我觉得很奇怪，升降机里面的观察者必须总在“地板”上，因为他一跳起来，地板就会重新碰到他。

里面的观察者：我看不出有什么理由可以认为我的升降机在作绝对运动。我同意，与我的升降机刚性连接的坐标系其实不是惯性系，但我并不认为它与绝对运动有什么关系。我的表、手帕以及所有物体之所以下落，是因为整个升降机都在引力场中。我和地面上的人观察到的是完全相同的运动。地面上的人对物体下落的解释很简单，那就是引力场的作用。我也是如此。

升降机内外的观察者所作的这两种描述都很能自圆其说，我们无法判定谁是正确的。我们可以采用其中任何一种来描述升降机中的现象：要么按照外面的观察者所主张的，物体作非匀速运动，没有引力场；要么按照里面的观察者所主张的，物体静止，存在引力场。

外面的观察者也许认为升降机在作“绝对的”非匀速直线运动，但一种能被引力场假设取消掉的运动不能被视为绝对运动。

我们也许能找到一种办法从这两种如此不同的描述中走出来，决定支持哪一种，反对哪一种。设想有一束光经由侧面窗户水平地射入升降机，极短时间之后射到对面的墙上。我们再看看这两位观察者如何预言光的路径。

外面的观察者认为升降机在作加速运动，他会说：光线射入窗户之后将沿直线以恒定的速度水平地射向对面的墙。但升降机正在上升，在光朝着墙壁运动的时间里，升降机已经改变了位置。因此，光线射到墙壁上的点不会与入射点截然相对，而会稍微低一点。这个差异将会很小，但总是存在的，于是相对于升降机，光线不是沿直线，而是沿着略为弯曲的曲线行进。这是因为在光线穿过升降机内部期间，升降机已经移动了一段距离。

里面的观察者则认为升降机中的一切物体都受到引力场的作用，他会说：不存在升降机的加速运动，只存在引力场的作用。光束没有重量，因此不会受到引力场的影响。如果沿水平方向发射，它将射到与入射点截然相对的那个点上。

从这种讨论来看，似乎可以在这两种相反观点中作出判定，因为两位观察者看到的现象是不同的。如果刚才引述的两种解释并非不合理，那么我们之前的整个论证都会被推翻。我们不能用有引力场和无引力场这两种一致的方式来描述所有现象。

但幸运的是，里面的观察者的推理中有一个严重的错误，它挽救了我们前面的结论。他说“光束没有重量，因此不会受到引力场的影响”，这是不正确的！光束携带着能量，而能量有质量。但任何惯性质量都被引力场所吸引，因为惯性质量和引力质量是等效的。光束在引力场中会弯曲，就像以光速水平抛出的物体会偏折路线一样。倘若里面的观察者推理正确，考虑了光线在引力场中的弯曲，他的结果就会与外面观察者的结果完全一致。

当然，地球的引力场太弱了，以至于无法用实验来直接证明光线在地球引力场中的弯曲。但在日食期间所做的著名实验却决定性地间接证明了引力场对光线路径的影响。

从这些例子中可以看出，提出一种相对论物理学是很有希望和有充分根据的。但为此我们必须先来处理引力问题。

我们从升降机的例子中可以看出这两种描述的一致性。既可以假定非匀速运动，也可以不假定。我们可以通过引力场把“绝对”运动从这些例子中消除。但那样一来，非匀速运动中就没有任何绝对的东西了。引力场能将其彻底消除。

我们可以把绝对运动和惯性坐标系的幽灵从物理学中赶出去，建立一种新的相对论物理学。我们的理想实验表明广义相对论的问题与引力问题是密切相关的，并且显示了引力质量与惯性质量的等效为什么对这种关联至关重要。显然，广义相对论中引力问题的解必定不同于牛顿引力问题的解。和所有自然定律一样，引力定律必须在所有可能的坐标系中都有效，而牛顿提出的经典力学定律只在惯性坐标系中才有效。

12.几何学与实验

我们的下一个例子甚至比下落的升降机的例子还要奇特。我们必须讨论一个新问题，即广义相对论与几何学之间的关联。我们先来描述一个生活着二维生物而非三维生物的世界。电影已经使我们习惯于在二维银幕上表演的二维生物。现在让我们设想银幕上的这些“影人”是实际存在的，他们有思维能力，能够创建自己的科学，二维银幕就是他们的几何空间。这些生物无法具体想象三维空间，就像我们无法想象四维世界一样。他们可以折弯直线，知道圆是什么，但却造不出球体，因为这意味着舍弃了他们的二维银幕。我们的处境也是类似的。我们能把线和面折弯，却很难想象一个折弯的三维空间。

通过生活、思考和实验，这些“影人”最终可以精通二维的欧几里得几何学知识。例如，他们可以证明三角形的内角之和等于180度，可以作两个同心圆。他们会发现，这样两个圆的周长之比等于它们的半径之比，这个结果正是欧几里得几何学的典型特征。倘若银幕无限大，这些“影人”会发现，一旦开始笔直前行，他们就永远回不到起点。

现在我们设想这些二维生物的生活环境改变了。有人从外面即“第三维”把他们从银幕移到了半径很大的球面上。如果这些“影人”与整个球面相比极小，无法作远距离通信，又不能移动很远，则他们将感觉不到有任何变化。小三角形的内角之和仍然等于180度。两个同心圆的半径之比仍然等于周长之比。他们沿着直线旅行仍然回不到起点。

但假定这些“影人”渐渐发展出他们的理论知识和技术知识。他们发明了交通工具，能够快速通过遥远的距离。他们将会发现，笔直前行最终还是会回到起点。“笔直前行”意指沿着球体的大圆移动。他们也会发现，两个同心圆的周长之比不等于半径之比。

如果我们的二维生物很保守，而且过去几代学的都是欧几里得几何学（那时他们还不能远行，这种几何学与观测事实相符），那么即使其测量结果有一定误差，他们也肯定会尽一切努力去维护这种几何学。他们可能会尽量用物理学来解释这些不一致，比如寻找一些像温差这样的物理学理由来解释线的变形，从而导致与欧几里得几何学的偏离。但他们迟早会发现，可以用一种更合乎逻辑和更令人信服的方法来描述这些事件。他们终将懂得自己的世界是有限的，其几何学原理与他们学到的有很大区别。他们会知道自己的世界是一个球体的二维表面，尽管无法去想象这一点。他们很快就会学习新的几何学原理，这些原理虽然不同于欧几里得的，但可以针对其二维世界以同样一致和逻辑的方式表述出来。对于学过球面几何学知识的下一代二维生物而言，旧的欧几里得几何学会显得更为复杂和人为，因为它并不符合观察到的事实。

让我们回到我们世界中的三维生物。

说我们的三维空间有一种欧几里得特征，这是什么意思呢？它的意思是，所有得到逻辑证明的欧几里得几何学命题也能用实际的实验加以确证。借助于刚性物体或光线，我们可以构造出与欧几里得几何学的理想化对象相对应的物体。尺子的边缘或一束光都对应于一条线；用刚性细杆构成的三角形的内角之和等于180度；用坚韧的金属丝围成的同心圆的半径之比等于其周长之比。以这种方式来解释，欧几里得几何学就成了物理学的一章，尽管是非常简单的一章。

但我们可以设想差异已经被发现了：例如，由刚性量杆构成的大三角形的内角之和不再等于180度。由于我们已经习惯于用刚性物体来具体表示欧几里得几何学的对象，我们也许应当寻找某种物理的力来解释我们量杆的这种出乎预料的形变。我们应当力求发现这种力的物理性质及其对其他现象的影响。为了挽救欧几里得几何学，我们可以指责物体并非刚性，与欧几里得几何学中的形体并不完全符合。我们应当努力找到更好的物体，其表现与欧几里得几何学所期望的完全一致。然而，倘若我们未能把欧几里得几何学与物理学结合成一幅简单一致的图景，我们就不得不放弃我们的空间是欧几里得空间这一观念，并按照关于我们空间几何性质的更一般假设寻求一种更令人信服的实在图景。

我们可以用一个理想实验来说明这种必要性。这个实验表明，真正的相对论物理学不可能建立在欧几里得几何学的基础上。我们的论点将会蕴含着我们已经了解的关于惯性坐标系和狭义相对论的结果。

设想有一个大圆盘，上面画着两个同心圆，一个很小，另一个很大。圆盘飞快地旋转。圆盘是相对于外面的观察者转动的，圆盘上还有一个观察者。我们进一步假定，外面观察者的坐标系是惯性坐标系，他也可以在自己的惯性坐标系中画出同样一大一小的两个圆，这两个圆在他的坐标系中是静止的，但与旋转圆盘上的圆重合。他的坐标系是惯性的，因此欧几里得几何学在他的坐标系中是有效的，他将发现两圆的周长之比等于半径之比。但圆盘上的观察者发现了什么呢？从经典物理学和狭义相对论的观点来看，他的坐标系是禁用的。但要想为物理定律找到在任何坐标系中都有效的新形式，就必须同样严肃地对待圆盘上和圆盘外的观察者。现在我们从外面注视圆盘上的观察者，看他如何通过测量来查明旋转圆盘上的周长和半径。他和外面的观察者使用的是同样的小量杆。所谓“同样”，要么是指实实在在地相同，就是说它是由外面的观察者递给圆盘上的观察者的；要么是指在一个坐标系中静止时具有相同长度的两根量杆中的一根。

圆盘上的观察者开始在圆盘上测量小圆的半径和周长，他的测量结果必定与外面的观察者完全相同。圆盘的旋转轴通过圆盘的中心，圆盘中心附近的部分速度很小。如果圆足够小，我们就可以放心地使用经典物理学而不必考虑狭义相对论。这意味着，对于圆盘上和外面的观察者来说，量杆的长度是一样的，因此两人的测量结果也将相同。现在圆盘上的观察者又来测量大圆的半径。在外面的观察者看来，放在半径上的量杆在运动。但由于运动方向与量杆垂直，所以这根量杆并不收缩，在两位观察者看来长度相同。于是，对这两位观察者来说，三种测量结果都相同：两个半径和一个小圆周长。而第四种测量却不然！两位观察者测得的大圆周长并不相同。在外面的观察者看来，沿着运动方向放在圆周上的量杆与静止时相比显得收缩了。外圆的速度比内圆大得多，所以必须考虑这种收缩。因此，运用狭义相对论的结果，我们的结论是：两位观察者测出的大圆周长一定是不同的。由于两位观察者测量的四种长度中只有一种是不同的，所以圆盘上的观察者不会像外面的观察者那样认为两半径之比等于两周长之比。这意味着，圆盘上的观察者无法在他的坐标系中确证欧几里得几何学的有效性。

得到这个结果之后，圆盘上的观察者可以说，他不想考虑欧几里得几何学在其中无效的坐标系。欧几里得几何学之所以不成立是因为绝对转动，是因为他的坐标系是坏的和被禁用的。但在以这种方式论证时，他已经拒斥了广义相对论中的主要观念。另一方面，如果我们想拒斥绝对运动，保留广义相对论的观念，就必须把物理学建立在一种比欧几里得几何学更一般的几何学的基础上。只要所有坐标系都可以允许，就无法摆脱这个结局。

广义相对论所带来的变化不能仅限于空间。在狭义相对论中，静止在一个坐标系中的各个钟是同步的，亦即同时指示相同的时刻。那么，非惯性坐标系中的钟会怎样呢？我们还用那个关于圆盘的理想实验。外面的观察者在其惯性坐标系中有许多同步的完美的钟。圆盘上的观察者从中拿出两个，一个放在小的内圆上，另一个放在大的外圆上。内圆上的钟相对于外面的观察者速度很小。于是我们可以放心地断定，它的快慢与圆盘外面的钟相同。但大圆上的钟速度很大，与外面观察者的钟相比快慢变了，因此与放在小圆上的钟相比快慢也变了。于是，两个旋转的钟将会有不同的快慢。运用狭义相对论的结果，我们再次发现在我们的旋转坐标系中做不出类似于惯性坐标系中那样的安排。

为了说明从这个以及前面描述的理想实验中可以得出怎样的结论，我们再次引述相信经典物理学的旧物理学家（“古”）和懂得广义相对论的现代物理学家（“今”）之间的一段对话。旧物理学家是处于惯性坐标系中的外面的观察者，而现代物理学家则是处于旋转圆盘上的观察者。

古：在你的坐标系中，欧几里得几何学是无效的。我观察了你的测量，我承认在你的坐标系中，两个圆的周长之比并不等于半径之比。但这表明你的坐标系是被禁用的。可我的坐标系是惯性的，我可以放心地使用欧几里得几何学。你的圆盘在作绝对运动，从经典物理学的观点来看，它是一个被禁用的坐标系，在其中力学定律是无效的。

今：我不想听任何关于绝对运动的说法。我的坐标系和你的一样好。我看到你相对我的圆盘在旋转。没有人能禁止我把所有运动都与我的圆盘相关联。

古：但你不觉得有一种奇怪的力使你远离圆盘中央吗？假如你的圆盘不是一个快速转动的旋转木马，你所观察到的两种情况就不可能发生。你不会感到有一种力把你向外推，也不会注意到欧几里得几何学在你的坐标系中不能用。这些事实难道不足以让你相信你的坐标系在作绝对运动吗？

今：绝非如此！我当然注意到了你所提到的两个事实，但我认为它们之所以发生，是因为有一个奇特的引力场作用于我的圆盘。指向圆盘外面的这个引力场使我的刚性量杆发生形变，使我的钟改变快慢。在我看来，引力场、非欧几何和不同快慢的钟是密切相关的。采用任何坐标系，我必须同时假定存在着一个适当的引力场及其对刚性量杆和钟的影响。

古：但是，你知道你的广义相对论所引起的困难吗？我想用一个简单的非物理学的例子来澄清我的观点。想象一座理想的美国城市，它由一条条南北街和与之垂直的东西路所组成。街与街的距离、路与路的距离是相同的。如果这些假设得到满足，那么每一个街区都是同样大小。用这种方法很容易描述任一街区的位置。但如果没有欧几里得几何学，这样一种构图是不可能的。例如，我们不能用一个很大的理想美国城市把整个地球覆盖起来。这一点只要看看地球就知道了。但我们也不能用这样一幅“美国城市图”把你的圆盘覆盖起来。你说引力场已经使你的量杆发生了形变。你无法确证关于半径之比等于周长之比的欧几里得定理，这就清楚地表明，如果你把这样一种街道图带到足够远的地方，便迟早会陷入困难，而发现这在你的圆盘上是不可能的。你旋转圆盘上的几何学类似于曲面上的几何学，而在足够大的曲面上，这样的街道图当然是不可能的。再举一个更物理的例子。假定把一个平面的各个部分不规则地加热到不同温度。你能用长度随温度而膨胀的小铁杆作出下面这幅“平行－垂直”图吗？当然不能！你的“引力场”对你的量杆所起的作用和温度改变对小铁杆所起的作用是一样的。

今：所有这些都吓不倒我。需要用街道图来确定点的位置，用钟来确定事件的次序。但城市未必是美国的，它也可以是古代欧洲的。想象你的理想城市是由塑料做成的，然后发生了形变。虽然街道已经不再笔直和等距，但我仍然可以数出街区，认出街道。同样，我们在地球上用经纬度来标明点的位置，尽管不是“美国城市”的构图。

古：但我还是看到一个困难。你不得不用你的“欧洲城市图”。我承认你能确定点或事件的次序，但这种图会把一切距离测量弄乱。它无法像我的图那样给出空间的度规性质。举例来说，我知道在我的美国城市中，要想走十个街区，我必须经过五个街区距离的两倍。我知道所有街区都相等，所以我能立即确定距离。

今：你说的不错。在我的“欧洲城市”图中，我无法通过变形街区的数目立即确定距离。我必须知道更多的东西，必须知道我的表面的几何性质。众所周知，同样是从经度0度到10度的距离，在赤道上和在北极附近是不等的。但每一位航海家都知道如何在地球上确定这样两点之间的距离，因为他知道地球的几何性质。他要么根据球面三角学知识来计算，要么把他的船以相同的速度驶过这两段距离，用实验方法来计算。在你的例子中，整个问题很简单，因为所有街和路都是等距的。而在我们的地球上，情况要更为复杂，0度与10度的两条经线在地球两极相遇，在赤道上则相距最远。同样，为了在我的“欧洲城市图”中确定距离，我必须比你在“美国城市图”中多知道一些东西。为了得到这种额外的知识，我可以在每一种特殊情况下研究我的连续区的几何性质。

古：但所有这些都只不过表明，放弃欧几里得几何学的简单结构，启用你决心使用的复杂框架是如何的不便和复杂罢了。难道这真是必需的吗？

今：如果想把物理学应用到任何坐标系，而不是神秘的惯性坐标系，我想这是不可避免的。我承认我的数学工具比你的更复杂，但我的物理假设却更加简单自然。

这个讨论只限于二维连续区。广义相对论中的争论要更为复杂，因为那里不是二维连续区而是四维时－空连续区，但想法与二维情形一样。在广义相对论中，我们不能像在狭义相对论中那样使用由平行和垂直的量杆以及同步的钟所组成的力学框架。在一个任意的坐标系中，我们无法用刚性量杆和同步的钟来确定一个事件发生的地点和时刻，就像在狭义相对论的惯性坐标系中那样。我们仍然可以用非欧几里得的量杆和快慢不同的钟来确定事件。但需要用刚性量杆和完全同步的钟来做的实际测量只能在局域的惯性坐标系中进行。在这种坐标系中，整个狭义相对论都是有效的。但我们的“好”坐标系只是局域的，其惯性受空间和时间的限制。甚至在我们的任意坐标系中，我们也能预见到局域惯性坐标系中的测量结果。但为此我们必须知道我们时－空连续区的几何学特征。

我们的理想实验仅仅指出了新的相对论物理学的一般特征。这些实验表明，我们的基本问题是引力问题。它们还表明，广义相对论进一步推广了时间和空间概念。

13.广义相对论及其验证

广义相对论试图为所有坐标系提出物理定律。该理论的基本问题是引力问题。自牛顿时代以来，它第一次尝试重新表述引力定律。这真是必需的吗？我们已经了解过牛顿理论的伟大成就以及建立在牛顿引力定律基础上的伟大天文学进展。直至今日，牛顿定律仍然是所有天文学计算的基础。但我们也听说过对于旧理论的一些反驳。牛顿定律只在经典物理学的惯性坐标系中有效，我们还记得，所谓惯性坐标系是指力学定律在其中有效的坐标系。两个质量之间的力与两者之间的距离有关。我们知道，力与距离的关系对于经典变换是不变的。但这个定律并不符合狭义相对论的框架。该距离对于洛伦兹变换并非不变。就像对运动定律一样，我们可以设法把引力定律加以推广，使之符合狭义相对论，或者换句话说，使引力定律的表述对于洛伦兹变换不变，而不是对于经典变换不变。但无论我们如何努力，也无法把牛顿的引力定律简化，把它纳入狭义相对论的框架。即使在这方面取得成功，我们也仍然需要更进一步，从狭义相对论的惯性坐标系迈向广义相对论的任意坐标系。另一方面，关于下落升降机的理想实验清楚地表明，除非解决了引力问题，否则不可能提出广义相对论。由此我们可以看到，为什么引力问题的解决在经典物理学和广义相对论中是不同的。

我们曾试图说明通往广义相对论的道路以及迫使我们再次改变旧观点的理由。我们不去深入广义相对论的形式结构，而只是刻画新的引力理论与旧理论相比有什么特征。根据以上所述，掌握这些差别的实质应当并不困难。

（1）广义相对论的引力方程可以应用于任何坐标系。在某一情形中选择某个特定的坐标系仅仅是出于方便。从理论上讲，所有坐标系都是允许的。如果不考虑引力，我们会自动回到狭义相对论的惯性坐标系。

（2）牛顿的引力定律把此时此地的一个物体的运动与同一时刻远处某一物体的作用联系在一起。此定律已经成为我们整个力学观的一个典范。但力学观崩溃了。在麦克斯韦方程中，我们看到了自然定律的一个新的典范。麦克斯韦方程是结构定律。它们把此时此地发生的事件与稍后附近发生的事件联系起来，是描述电磁场变化的定律。我们新的引力方程也是描述引力场变化的结构定律。扼要地讲，我们可以说：从牛顿的引力定律过渡到广义相对论，有些类似于从库仑定律的电流体理论过渡到麦克斯韦理论。

（3）我们的世界并不是欧几里得式的。我们世界的几何本性由质量及其速度来决定。广义相对论的引力方程试图揭示我们世界的几何本性。

暂且假定我们已经成功实现了广义相对论的纲领。但我们的猜想是否有过分脱离实在的危险呢？我们知道，旧理论很好地解释了天文学观测。是否有可能在新理论与观测之间建起一座桥梁呢？任何猜想都必须接受实验的检验，任何结果，无论多么吸引人，倘若不符合事实，都必须拒斥。新的引力理论能否经受实验检验呢？对于这个问题，我们可以用一句话来回答：旧理论是新理论的一种特殊的极限情形。如果引力较弱，旧牛顿定律就会是新引力定律的很好近似。因此，所有支持经典理论的观测也支持广义相对论。我们从新理论的更高层次上重新获得了旧理论。

即使我们无法引用额外的观测来支持新理论，即使它的解释与旧理论不相上下，倘若在两种理论中自由选择，我们也应当支持新的。从形式上看，新理论的方程要更为复杂，但从基本原理上看，它却简单得多。绝对时间与惯性系这两个可怕的幽灵已经消失了。引力质量与惯性质量的等效这一线索也没有被忽视。关于引力及其与距离的关系，我们无须作任何假设。引力方程有着结构定律的形式，这是自场论取得伟大成就以来所有物理定律都必须具有的形式。

由新的引力定律可以引出不包含在牛顿引力定律中的一些新推论。我们曾经引述过一个推论，即光线在引力场中的弯曲。现在我们要提到另外两个推论。

如果引力较弱时旧定律可以从新定律中推出来，那么只有在引力较强时才能发现与牛顿引力定律的偏差。以我们的太阳系为例，包括地球在内的所有行星都沿着椭圆轨道围绕太阳运转。水星是距离太阳最近的行星。太阳与水星之间的引力要强于太阳与任何其他行星之间的引力，因为水星与太阳的距离较小。倘若有任何希望能够发现与牛顿定律的偏差，最大的机会就是水星。由经典理论可知，水星的运行轨道与任何其他行星是相同类型，只不过它离太阳更近。根据广义相对论，它的运动应该略有不同。水星不仅要围绕太阳运转，它的椭圆轨道也应相对于与太阳相连的坐标系缓慢转动。椭圆轨道的这种转动体现了广义相对论的新效应。新理论还预言了这个效应的大小，水星的椭圆轨道将在300万年后完成整个转动。由此可见，这种效应非常之小，距离太阳更远的行星更没有希望发现这个效应。

在提出广义相对论之前，人们已经知道水星轨道与椭圆的偏差，但无法作出解释。另一方面，广义相对论是在完全没有注意到这个特殊问题的情况下而发展起来的。只是后来才从新的引力方程中推出了行星围绕太阳运转的椭圆轨道本身也在转动的结论。就水星而言，理论成功地解释了水星的运动与牛顿定律预言的运动之间的偏离。

但从广义相对论中还可以推出一个结论可与实验进行比较。我们已经看到，放在旋转圆盘大圆上的钟与放在小圆上的钟快慢不同。同样，由相对论可以推出，放在太阳上的钟与放在地球上的钟快慢不同，因为引力场在太阳上比在地球上要强得多。

前面说过，炽热的钠会发出一定波长的单色黄光。在这种辐射中，原子显示了它的一种快慢；可以说，原子代表钟，发射的波长则代表钟的快慢。根据广义相对论，太阳上钠原子发出光的波长应当略长于地球上钠原子发出光的波长。

通过观测来检验广义相对论的推论是一个非常复杂的问题，而且绝没有得到明确无疑的解决。由于我们只关注主要观念，所以不打算作深入讨论，但可以说，迄今为止的实验判决似乎确证了广义相对论的结论。

14.场与物质

我们已经看到了力学观崩溃的过程和原因。不可能通过假定不变的粒子之间有简单的作用力来解释一切现象。事实证明，我们超越力学观、引入场的概念的最初尝试在电磁现象领域最为成功。电磁场的结构定律得以确立，它们把空间和时间中彼此非常接近的事件联系起来。这些定律符合狭义相对论的框架，因为它们对于洛伦兹变换是不变的。后来，广义相对论提出了引力定律，它们同样是描述物质粒子之间引力场的结构定律。就像广义相对论的引力定律那样，我们同样很容易对麦克斯韦的定律进行推广，使之适用于任何坐标系。

我们有两种实在：物质和场。毫无疑问，我们现在不能像19世纪初的物理学家那样想象把整个物理学都建立在物质概念的基础上。我们现在把物质和场这两个概念都接受下来。我们能把物质和场看成两种不同的实在吗？给定一个物质粒子，我们对它可以作这样一种朴素的刻画：该粒子有一个明确的表面，在那里物质不再存在，其引力场也在那里出现。在我们的图景中，场定律有效的区域和物质存在的区域是突然分开的。但区分物质与场的物理标准是什么呢？在了解相对论之前，我们可能会这样来尝试回答这个问题：物质有质量而场没有质量。场代表能量，物质代表质量。但获得更多知识以后，我们已经知道这样的回答是不够的。从相对论中我们得知，物质储藏着大量能量，而能量又代表物质。我们不能以这种方式对物质与场进行定性的区分，因为质量与能量之间的区分并不是定性的。物质之中集中着最大部分的能量，但微粒周围的场也代表能量，尽管量要小得多。因此我们可以说：物质是能量最为集中的地方，场则是能量较少集中的地方。但如果是这样，那么物质与场之间的区别就是定量的而不是定性的。把物质和场看成两种性质完全不同的东西是没有道理的。我们无法想象有一个明确的表面把场与物质截然分开。

电荷和它的场也有同样的困难。我们似乎给不出明显的定性标准来区分物质和场或者电荷和场。

在能量非常集中的地方，或者说在电荷或物质等场源存在的地方，我们的结构定律，即麦克斯韦定律和引力定律就失效了。但我们难道不能对这些方程略作修改，使之到处有效，甚至在能量非常集中的地方也能有效吗？

我们不能仅仅基于物质概念来建立物理学。但在认识到质量与能量等效之后，物质与场的划分就显得有些人为和模糊了。我们能否拒斥物质概念，建立起一种纯粹的场物理学呢？我们感觉到的物质其实只是能量大大集中在一个较小的空间中而已。我们可以把物质看成空间中场特别强的一些区域，由此来创建一种新的哲学背景。其最终目标就是用随时随地都有效的结构定律来解释自然之中的一切事件。从这种观点来看，抛出的石头就是一个变化着的场，在这个场中，场强最大的状态以石头的速度穿过空间。在我们这种新物理学中，场与物质不能都是实在，场是唯一的实在。场物理学取得了伟大的成就，把电、磁和引力的定律成功地表达为结构定律的形式，还有质量与能量的等效，所有这些都暗示了这种新的观点。我们最后的问题便是改变我们的场定律，使之在能量非常集中的地方也不失效。

但迄今为止，我们仍然没有令人信服和前后一致地成功实现这个纲领。究竟能否实现，现在还不好说。目前我们在所有实际的理论构建中仍然要假定两种实在：场与物质。

基本问题仍然摆在我们眼前。我们知道，所有物质都是由少数几种粒子构成的。各式各样的物质是如何由这些基本粒子构成的呢？这些基本粒子与场是如何相互作用的呢？为了寻求这些问题的答案，物理学中又引入了新的观念，即量子理论的观念。

总结：

物理学中出现了一个新的概念——场，这是自牛顿时代以来最重要的发明。对于描述物理现象必不可少的不是电荷，也不是粒子，而是电荷之间与粒子之间的场，这需要很大的科学想象力才能认识到。事实证明，场的概念非常成功，由这个概念引出了描述电磁场结构以及支配电现象和光现象的麦克斯韦方程。

相对论源于场的问题。旧理论的矛盾和不一致迫使我们把新的性质归于时-空连续区，归于我们物理世界中所有事件的舞台。

相对论的发展有两步。第一步产生了所谓的狭义相对论，它只适用于惯性坐标系，即牛顿表述的惯性定律在其中有效的系统。狭义相对论基于两条基本假设：在所有相对作匀速直线运动的坐标系中物理定律都相同；光速总有相同的值。由这些已被实验充分确证的假设可以推出，运动量杆的长度以及钟的快慢随速度而改变。相对论改变了力学定律。如果运动粒子的速度接近光速，旧的定律就失效了。实验出色地确证了相对论为运动物体重新提出的定律。（狭义）相对论的另一个推论便是质能关系。质量是能量，能量有质量。相对论把质量守恒定律与能量守恒定律结合成一个质-能守恒定律。

广义相对论对时-空连续区作了更深入的分析，其有效性不再局限于惯性坐标系。它处理了引力问题，为引力场提出了新的结构定律。广义相对论迫使我们分析几何学对于描述物理世界的作用。它把引力质量与惯性质量的相等看得至关重要，而不像经典力学那样把它看成纯粹偶然。广义相对论的实验结果与经典力学的结果只有略微不同。只要是有可能进行比较的地方，它都经受住了实验的检验。然而，广义相对论的长处在于它内在的一致性和基本假设的简单性。

相对论强调了场的概念在物理学中的重要性，但我们尚不能成功地提出一种纯粹的场物理学。目前我们仍然要假定场和物质都存在。

物理学的进化爱因斯坦作品集

第三章 场，相对论

物理学的进化
爱因斯坦作品集

第三章　场，相对论