hg2088.com

科普|向量从莱布尼兹到爱因斯坦

分类:hg2088.com 作者:admin 来源:未知 发布:2024-01-18 13:57

  《小乐数学科普》,公益翻译普及国外开放数学为主,提炼古今中外数学思想,助你成为各行业翘楚。zzllrr小乐,小乐数学zzllrr Mather(开源数学软件)、小乐RSS阅读器、小乐图客zzllrr Imager Geek等原创项目作者。

  德国哲学家兼科学家戈特弗里德·莱布尼茨(Gottfried Leibniz,1646 - 1716)梦想着一种通用语言和一种与之相伴的计算方法,这样,如果在任何主题上出现争议,争论者可以惊呼“Calculemus!”(“让我们计算一下!”)然后通过这种方法将产生答案。

  这是一个大胆的梦想,莱布尼茨知道这一点,但是,为了将他梦想语言的一个小角落变为现实,他试图发明一种融合代数和几何的“情境几何”(geometry of situation)。他采用“♉”(金牛座的黄道符号)来表示全等(congruence,几何中一般译为全等,数论中一般译为同余,zzllrr小乐译注)关系,并试图将所有传统的几何概念简化为♉的性质。⊃1;莱布尼茨的目标是设计一种“立体几何 2.0”,让他和其他人能够通过先将几何情况转化为涉及 ♉的命题陈述,然后使用适当的公理从这些命题陈述中进行代数式的推理。

  莱布尼茨在1679年写信给他的朋友荷兰数学家克里斯蒂安·惠更斯(Christian Huygens,1629 - 1695),他设想了一种语言,不仅可以描述几何学,还可以描述机器的行为。“我相信,通过这种方法,人们可以像对待几何一样对待力学,甚至可以测试材料的质量。”莱布尼茨未能说服惠更斯和其他人帮助他发展他的想法,但事后看来,我们可以在他写的东西中看到向量(vector,也即矢量)思想的微光。如果他的系统建立在平移全等(translational congruence)的基础上——一个图形只使用滑动而不是旋转变成另一个图形时,这种关系成立——他会更接近现代的向量概念以及这个概念导致的一切,包括(最近的)聊天机器人。

  大约在同一时期,莱布尼茨的英国竞争对手艾萨克·牛顿(Isaac Newton,1643 - 1727)在他的伟大著作《数学原理》(Principia Mathematica)中确立了牛顿物理学的原理,使用经典的二维和三维几何学作为舞台,名为“运动”(motion)和“力”(force)的新演员在舞台上占据了它们的位置并说出了它们的台词——这些预示性的台词,例如“物体受两个力共同作用可以描述为平行四边形的对角线,其中每个力单独作用时分别描述为平行四边形的一条边。”牛顿发现,对力的分析需要人们同时询问“力有多大?”以及“在什么方向上施力?”,在这方面,他预见了向量的概念,向量是具有大小(magnitude)和方向(direction)的数学量。

  作为力组合方式的一个例子,想象两个人分别走在运河的两侧,拉着拴在船上的绳索。为简单起见,假设两根绳索都连接在船头的同一点。如果步行者在运河的两侧并排行走并以相等的力量拉动,那么船将沿着运河笔直行驶,但步行者只有一些肌肉力驱动着船前进;其余的力则在一种拔河比赛(tug-of-war)中被抵消,因为一个步行者将船拉向左边,而另一个步行者将船拉到右边。平行四边形定律以图形方式使这种部分抵消被定量化。要确定作用在船上的有效力,请绘制平行四边形 OABC,其中O是船头绳索的公共连接点,A和B 是步行者的位置,C是平行四边形的第四个点。作用在船上的有效力与线段OC的长度成正比,因此,如果两个步行者只在船前走了一小段距离(如下图左半部分),那么他们的大部分力就会被横向浪费掉,而如果步行者远远领先于船(如下图右半部分),那么浪费的力就很少了。在后一种情况下,线段OC的长度几乎等于线段OA和OB的长度之和,因此将船向前拉的力几乎与两个步行者奇迹般地在船正前方的水面上行走一样大。

  数学家萨洛蒙·博赫纳(Salomon Bochner,1899 - 1982)后来写道:“作为《牛顿数学原理》基础的欧几里得空间,与从泰勒斯到阿波罗尼乌斯的希腊数学(和物理学)基础的欧几里得空间,在数学上并不完全相同。...《原理》的欧几里得空间仍然是这一切,然而它也是新的东西。”

  在莱布尼茨和牛顿之后的一个世纪,严格数学意义上的向量是由丹麦-挪威数学家和制图师卡斯帕·韦塞尔(Caspar Wessel,1745 - 1818)发明的。Wessel描述了一种添加直线的方法(像我这样的现代学究称它们为线段line segment),例如下面的AB和CD。

  “如果我们以这样一种方式将它们合并,即第二条线从第一条线结束的地方开始,然后从联合线的第一点到最后一点通过一条直线,就会添加两条直线。这条线是联合线的总和。从图形上看,我们向上和向左移动线段CD(滑动,而不是旋转),直到C与B重合,则D与某个我称之为E的点重合;将线段AE声明为线段AB和CD 之和,如下图所示。请注意,这是一个纯粹的几何结构,没有关于速度、力等等想法(尽管让人想起它们)。

  Wessel认为A是AB的“第一个”点,B是“最后一个”点,它们在构造中扮演着不同的角色,所以在Wessel的定义中,AB和BA是不一样的;用现代术语来说,我们会说Wessel隐含地使用了有向线段(directed line segment)。现在习惯上用箭头来装饰有向线段,沿着有向线段的起点到终点。

  我将“从A开始到B结束的有向线段”写成A→B。如果第二个有向线段已经从第一个有向线段结束的地方开始,我们会得到一个特别漂亮的画面:A→B 加上 B→C 正好是 A→C。

  当两个有向线段的起点相同时,我们也得到了一个很好的画面。要将 A→B 和 A→C 相加,请找到与点A、B和C形成完整平行四边形的点D;那么 A→B 和 A→C 的总和就是 A→D,就像前面的运河船图片一样。

  箭头图未能公正地处理一个重要的特殊情况,即 A→A,一个有向线段,在它开始的地方结束,对应于一个无处可去的运动。在Wessel的理论中,这是加法恒等元(additive identity element):将其添加到任何有向线段只会再次返回该有向线段。同样,有向线段 B→A 是有向线段 A→B 的加法逆(additive inverse);如果按任一顺序将它们相加,则得到恒等元。

  当我们使用笛卡尔坐标时,事情可能会变得混乱,因为点和向量都通过有序对表示。从坐标为(x,y)的点到坐标为(x,y)的点的位移是向右位移(x−x)单位以及向上位移(y−y)单位(通常的理解是,向右的负位移意味着向左的正位移,向上的负位移意味着向下的正位移);许多人(尽管不是全部)将这个位移向量写成 [x−x,y-y]。就括号对而言,Wessel 的加法规则相当于 [a,b] + [c,d] = [a+c,b+d];也就是说,如果将向右位移a单位和向上位移b单位,以及向右位移c单位和向上位移d单位相加,则结果是向右位移(a+c)单位和向上位移(b+d)单位。另外,请注意[0,0]是你呆在所在位置的位移,而[-a,-b](也写成 -[a,b])是 [a,b]的反转(逆转)。

  唉,Wessel在1797年的突破被遗忘了,直到它闪耀的时刻过去很久之后。⊃2;

  向量理论的另一个先驱是奥古斯特·费迪南德·莫比乌斯(August Ferdinand Möbius,1790 - 1868)的重心计算(barycentric calculus)。⊃3; 1827年,在他发现他现在闻名的扭曲曲面的三十年前,莫比乌斯对阿基米德通过物理学分支(称为静力学statics)证明几何定理的方法提出了新的转折。静力学是对平衡(equilibrium)的研究,例如梁的平衡在支点两侧相对的向下力之间完美平衡,阿基米德巧妙地利用了重心的概念来计算以抛物线弧为界的区域的面积等。

  在重心计算中,我们可以添加点,或者更确切地说,点质量(point-mass),例如,某个点的1个质量单位加上其他点的1个质量单位“等于”中点的2个质量单位。要了解此定义背后的物理直觉(至少在点A和点B及其中点M位于水平线上的情况下),请想象一个平衡木在 A 处支撑1个单位的质量,在B处支撑1个单位的质量,如下图所示。假设左边有一个支点(fulcrum),左边有一个更远的砝码,精确地平衡了A和B处的砝码组合。现在假设我们将A处的砝码向右滑动,同时将B处的砝码向左滑动相同的距离;横梁将继续保持平衡,因为两个砝码(的组合)的重心不受影响。当两个砝码相遇时,我们在M处将有2个质量单位,并且梁仍将平衡;因此,A处的1个质量单位加上B处的1个质量单位等于中点M处的2个质量单位。跟随莫比乌斯,我们写成 1A + 1B = 2M。在这个特定的例子中,A、B 和 M 位于一条水平线上,但在莫比乌斯的实际定义中,水平线M

  莫比乌斯的工作萎靡不振,部分原因是他的方法与他同时代人的研究重点无关,因此被认为没有用。莫比乌斯出生得太晚,晚了两千年(阿基米德会喜欢他的工作)或早了两个世纪(高中数学赛手利用重心计算,重新命名为“质点几何”(mass point geometry),作为秘密武器⁴ 用于解决棘手的几何问题)。

  重心计算没有流行起来的另一个原因是,即使是了解它的伟大数学家也发现它的某些部分令人困惑。问题是负质量。莫比乌斯不仅添加点;他也减去点,尽管他很难向别人解释其中之意。考虑三角形 ABC,其中两条边标记了中点(D位于A和B之间,E位于A和C之间),如下所示:

  在这张图中,我们有 1A + 1B = 2D 和 1A + 1C = 2E,因此从第一个方程中减去第二个方程(并抵消两个1A项),我们得到1B − 1C = 2D − 2E,或 1(B−C) = 2(D−E),莫比乌斯将其解释为线段BC平行于线段DE且长度是其两倍。这是一个很好的事实证明,但是1B − 1C 和 2D − 2E的质心在哪里?莫比乌斯说他们“处于无穷”,所以你可以看到为什么他的同时代人踟躇不前。⁵

  现代向量概念的另一位先知是德国数学家赫尔曼·格拉斯曼(Hermann Grassmann,1809 - 1877)。他的父亲是不太知名的数学家贾斯特斯·冈瑟·格拉斯曼(Justus Günther Grassmann,1779 - 1852),在1824年的一篇论文中写道:“矩形是其底和高的几何乘积,该乘积的行为方式与算术乘积相同。”老格拉斯曼说的不是边的长度,长度只是人们可以用普通方式相乘的数字;他把边说成是事物本身,能够以一种几何方式相乘,类似于但又不同于边长的数字乘法。

  年轻的格拉斯曼扩展了他父亲的想法,他说所有平行四边形,而不仅仅是矩形,都可以被看作是两个有向的量(directed magnitude)的乘积。凭借这一大胆的举措,他创立了几何代数(geometric algebra)学科。但在我进一步讨论这个问题之前,让我简化我使用的术语,因为“有向的量”和“有向线段”一样又长又拗口。在格拉斯曼之后的半个世纪里,作者威廉·克利福德(William Clifford,1845 - 1879)和卡尔·皮尔逊(Karl Pearson,1857 - 1936)在他们的《精确科学常识 Common Sense of the Exact Sciences》⁶一书中为非专业读者描述了克利福德关于格拉斯曼工作内容的版本,选择将“有向的量”称为“步”(step),我选择遵循它们;“step”(步)是一个比“vector”(向量)更令人生畏的词!所以我说(引用 Clifford 和 Pearson 的书)AP和AQ的几何乘积“要求我们平行移动步AQ,使得它的末端A横扫步AP;AQ在这次运动中描绘出的面积就是乘积值”——尽管正如我们将看到的,面积的概念需要进行一些调整才能完全符合格拉斯曼的目的。

  格拉斯曼重新发明了韦塞尔的几何加法(其中从A到B的步加上从B到C的步等于从A到C的步),并且注意到几何乘法在几何加法上是分配的:如果s,s和t是步,(s+s)×t等于s×t加上s×t,同样s×(t+t)等于s×t加上s×t。格拉斯曼认为这是一个令人鼓舞的标志。

  但他也意识到,他的理论的内在逻辑,要求他的乘法远非可交换的(commutative),而是反交换的(anticommutative):改变两个乘法因子的顺序会导致几何乘积改变符号!也就是说,几何乘积t×s必须等于几何乘积s×t的负数。格拉斯曼写道:“我最初对一个奇怪的结果感到困惑,尽管普通乘法的其他定律,包括乘法与加法的关系,在这种新型的乘法中得以保留,但人们只有在同时改变符号的情况下才能交换因子,即将加号变为减号,将减号变为加号。”

  为了消除我们自己的困惑,我们可以将这种符号变化与有符号的面积概念联系起来。克利福德和皮尔逊写道:“一个面积的符号取决于它的转动方式;逆时针旋转的面积是正的,顺时针旋转的面积是负的。”⁷

  克利福德和皮尔逊继续说道:“虽然 2×2 = 0 和 2×3 = −3×2 在2和3被视为仅仅是数字时,可能纯属无稽之谈,但当2和3被视为平面中的有向步时,它仍然成为彻头彻尾的常识。也就是说:如果我们用两个不同方向的步替换 2 和 3(称它们为s和t),并且我们采用这样的约定,即步s和t的几何乘积对应于按该顺序排列步s、步t、步−s 和步 −t 所描绘的平行四边形,然后s×t平行四边形和t×s平行四边形具有相反的面积(一个为负,一个为正),因为一个是顺时针横扫的,而另一个是逆时针横扫的。

  格拉斯曼的几何积(现在称为外积、楔形积 wedge product)并不局限于平面。例如,在三维空间中,两步的几何乘积是一个有向平行四边形。从技术上讲,这个乘积本身不是一个步,因为它是二维的⁸,但是我们可以用一个步来表示这个平行四边形,该步的大小与平行四边形的面积成正比,其方向垂直于平行四边形。如果我们这样做,那么步[a,b,c] 和步[a,b,c] 的乘积就是步 [bc−bc,ca−ac,ab−ab]。这有点重要。

  格拉斯曼还定义了另一种步相乘的方法,他称之为线性积(linear product)。步[a,b,c]和步 [a,b,c]的线性积是数字 aa+bb+cc。就像他的几何积一样,格拉斯曼的线性积是对加法有分配性的:如果我们把s和t的线性积写成 s·t(即使格拉斯曼没有,我也会这样做),我们有(s+s)·t = s·t + s·t 和 s·(t+t) = s·t + s·t。

  线性积的定义规则是s·t 等于 s的长度乘以t的长度乘以它们之间夹角的余弦。但是,如果你对三角(函数)生疏,以下是如何考虑这个问题:

  如果s和t指向完全相同的方向(即,如果它们之间的角度为0度),则s和t的线性积就是这两个步长度的数值乘积。

  如果s和t指向相反的方向(即,如果它们之间的角度为180度),则s和t的线性积是这两个步长度的数值乘积的负数。

  对于介于0到180度之间的角,s和t的线性积位于这两个极值之间,特别地,如果s和t指向垂直方向(即,如果它们之间的夹角为90度),则s和t的线。在这种情况下,我们也说这些步是正交的(orthogonal,正如在诸如“喜欢连分数的人比普通人不会更多可能也不会更少可能喜欢吃腌秋葵;这两个特征是正交的”)。

  在s=t(此时角度为0,余弦为1)的情况下,我们看到s·s(s与自身的线性积)是s长度的平方。这个特例很重要!它告诉我们,如果我们有线性积,那么我们就有一种方法可以自由定义长度。

  以这种设置为基础,我们可以推导出勾股定理(Pythagorean Theorem)。⁹类似的推理使我们能够以代数的方式从几何学中证明更复杂的事实,例如平行四边形对角线长度的平方和等于其四边长度的平方和。⊃1;⁰

  格拉斯曼的系统在1844年的著作《线性扩展理论,数学的新分支 Linear Extension Theory, a New Branch of Mathematics》中被提出,不仅限于二维和三维几何;该系统也包含更高维度的空间。事实上,格拉斯曼的公式为建立高维欧几里得空间理论奠定了基础。⊃1;⊃1;不幸的是,格拉斯曼的思想,就像他之前的韦塞尔和莫比乌斯的思想一样,在出版时就被大大忽视了。

  格拉斯曼不知道的是,在一年前的1844年,爱尔兰数学家威廉·罗文·哈密顿(William Rowan Hamilton ,1805 - 1865)找到了自己的途径,找到了格拉斯曼“量级”的三维特例的变体,即四元数。

  在我的文章《哈密顿的四元数或三元数的麻烦》(Hamiltons Quaternions, or, The Trouble with Triples)(参阅小乐数学科普:汉密尔顿(爱尔兰诗人数学家)的四元数,或三元数的麻烦)中,我提到威廉在十几岁时,他在拉普拉斯的《力学》(Mécanique Céleste)(牛顿的《原理》的续集)中发现了一个错误,这个错误逃脱了作者和该书许多读者的注意。我没有提到的是,哈密顿发现的错误在于拉普拉斯对力平行四边形定律的讨论。哈密顿的这种仔细阅读预示着他对三元数的兴趣,因为如果用三元数表示力(其各自的分量测量 x、y 和 z 方向上的力的大小),力的组成相当于三元数相加。一旦你知道如何将三元数相加,你难道不应该想办法将它们相乘吗?哈密顿是这么认为的。

  但哈密顿并没有通过物理学来解决这个问题。他通过复数来解决这个问题。如果拥有虚数i使数学更丰富,那么再添加一个独立的虚数不就会使数学更丰富吗?哈密顿寻求一种方法来乘以 r + ai + bj 形式的数字,其中 r、a 和 b 是普通实数,i 和 j 是两个独立的虚数。有一天,他意识到,他需要第三个虚数k,等于i乘以j,才能让事情正常进行。哈密顿的四元数是 r + ai + bj + ck 形式的数字,它们以直接的方式相加(因此 r+ai+bj+ck 加 r+ai+bj+ck 等于 (r+r)+(a+a)i+(b+b)j+(c+c)k )并以更复杂的方式相乘,乘法由分配律和下表支配:

  在研究他的理论的细节时,哈密顿发现,就乘法而言,写成r+ai+bj+ck的四元数迫切需要将它们的实部和虚部分开处理;也就是说,r+ai+bj+ck迫切需要被视为(r)+(ai+bj+ck)。⊃1;⊃2;他将r称为四元数的标量(scalar)部分,将ai+bj+ck称为向量(vector)部分。

  两者中的前者是格拉斯曼称之为线性积的量的相反数,后者与格拉斯曼的几何积基本相同。⊃1;⊃3;

  哈密顿和格拉斯曼是志同道合的多语种博学者,在数学之外有着不同的兴趣。两人都提出了非常原始的理论,结果在几个关键地方重叠。两人最初都在书籍中介绍了他们的理论,这些书籍以哲学序言开头,掩盖了他们的数学思想。然而,四元数流行起来,格拉斯曼的扩展理论却没有。我认为主要原因是哈密顿在提出四元数时已经很有名了;人们认为,被伟大的哈密顿认为重要的任何事情都必须值得学习。相比之下,格拉斯曼是一个默默无闻的人,当革命性的想法来自你从未听说过的人时,更容易忽视它们。⊃1;⁴

  美国科学家乔赛亚·威拉德·吉布斯(Josiah Willard Gibbs,1839 - 1903)最初被四元数迷住了,在这方面他并不孤单。后来成为“反四元数论者”的大多数人一开始都是四元数论者,他们甚至对哈密顿发明的四元数给予了极大的赞誉。但是他们已经注意到,对于大多数科学目的,四元数积本身并不是很有用;只有通过其主要成分,标量积和向量积,它似乎才起作用。吉布斯提出,两个向量 v 和 w 的哈密顿向量积称为叉积(cross product),用 v×w 表示,将两个向量的哈密顿标量积称为点积(dot product),用 v·w(以下我将遵循吉布斯,使用“向量”一词而不是“步”一词。)

  吉布斯的亲密盟友是数学家兼物理学家奥利弗·赫维赛德(Oliver Heaviside,1850 - 1925),他在成为理论家之前最初是一名务实电工,并且独立地为这两种积提出了分别相同的符号。在他经历了自己年轻时对四元数的迷恋多年后,赫维赛德写道:“我后来才发现,就我所要求的向量分析而言,四元数不仅不是必需的,而且是一种不小的正义的邪恶。”心灰意冷的信徒往往成为最极端的叛教者。

  另一方面,数学家彼得·格思里·泰特(Peter Guthrie Tait,1831 - 1901)是哈密顿1865年去世后四元数的主要拥护者,他确信四元数是宇宙结构的一部分,如果点积和叉积似乎是奇怪的同床者,那只是因为物理学家还没有建造出合适的床。

  詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell,1831 - 1879)可以说是那个时代最重要的物理学家,他是四元数的粉丝。在一定程度上受到四元数观点的启发,麦克斯韦统一了电学和磁学的理论,并得出了一个惊人的预测:在称为æther(即Aether,以太,第五元素,古希腊人假想的物质,已被现代物理学证明不存在,zzllrr小乐译注)⊃1;⁵的全渗透流体中应该存在自维持的电磁振荡波以光速传播。在物理学家海因里希·赫兹(Heinrich Hertz,1857 - 1894)验证了电磁波(我们现在知道是各种形式的光)的存在之后,麦克斯韦变得非常重要。麦克斯韦对四元数的兴趣使他的许多同时代人了解四元数,但许多同时代的人,尤其是物理学家,在一段时间后就失去了幻想。

  在1890年代和1900年代初期,十几位数学家和物理学家在公开场合就四元数的优点相互争辩。将反四元数论者称为“向量论者”(vectorialist)已经变得很普遍(这似乎不公平,因为“向量”(vector)一词来自哈密顿关于四元数的工作)。正如早期基督教的信条(homousian vs homoiusian)的名称在一个字母上有所不同一样,人们可以说,四元数论者和他们的反对者之间的区别可以用一个减号来概括。三元数(a,b,c)和(a,b,c)的标量积的四元数版本为−aa−bb−cc;负号是哈密顿设置的一个基本特征,因为虚数 i、j 和 k 是 −1 的平方根。但是物理学家发现aa+bb+cc的量要有用得多,并且很难接受这种看起来很自然的表达应该被视为起源于不太有用的-aa-bb-cc的说法。数学家和物理学家亚历山大·麦克法兰(Alexander MacFarlane,1851 - 1913)声称自己处于这场争斗之上,而不参与其中,但他写道,举证责任“落在负数人身上”。

  1891年,吉布斯在《自然》杂志上评论说,与四元数分析不同,向量分析(矢量分析)可以毫不费力地扩展到更高维的空间。他认为这是向量的加分项和四元数的减分项。但泰特却有不同的看法,他问道:“物理学的学生与超过三维的空间有什么关系?

  你可能知道,一些物理学家提出,我们实际上生活在一个超过三维的空间中,但由于各种原因,这些额外的维度并不容易被观察到。这些理论是万物理论(Theory of Everything,又译万有理论)的有力竞争者,所以泰特的反驳在现代人看来听起来有点老套。与此同时,向量已被证明对更多的人有用,而不仅仅是物理学家。特别是,近几十年来,计算机科学家通过使用高维向量取得了惊人的进步。告诉你接下来要看哪部电影的推荐系统可能通过向量来表示电影,这些向量对显著的电影属性进行数字编码,并使用点积来计算这些向量之间的角度,作为衡量它们相似程度的一种方式;请参阅文章 和 。机器学习的最新进展是通过支持向量机(support-vector machine,SVM)的概念建立在高维向量的概念之上的。机器学习最强大的方法之一是梯度下降( )的思想——一种深度的向量思想。我忍不住要提到,∇,梯度的符号,来自哈密顿。因此,即使四元数在科学中的作用已经减弱,哈密顿工作的广泛影响仍在继续扩大,并有望随着人工智能以目前迅猛的速度发展而继续扩大。

  但回到19世纪后期:人们进行了各种尝试,通过设计一种能够使用两者最佳特征的符号来调和四元数主义阵营和向量主义阵营。不幸的是,每个人对这种妥协应该是什么样子都有不同的想法。数学家和物理学家亚历山大·麦考利(Alexander McAulay,1863 - 1931)指出,向量系统的数量几乎与向量学家的数量一样多。他敦促,“小得可怜”的向量分析者群体,在倡导向量方法的事业中,应该将自己限制在两个系统内。“让我恳求他们把个人沉浸在共同的事业中。”⊃1;⁶

  与此同时,也有像数学物理学家威廉·汤姆森(William Thomson,1824 - 1907)这样的人,也被称为开尔文勋爵(Lord Kelvin),他们不属于任何一个阵营——不是因为像麦克法兰一样,他们认为自己是调解人,而是因为他们认为四元数论者和向量论者都陷入了一种时尚,忽视了古老的可靠实数的首要地位。毕竟,当人们在实验室里做研究时,人们在测量设备上看到的是数字,而不是向量或四元数。“向量是一种无用的幸存者,或者说是四元数的分支,对任何生物都没有丝毫用处,”汤姆森写道。汤姆森喜欢用三元数来写他的物理方程,其中一个方程关于Fx(x 方向上的力),另一个非常相似的方程关于Fy,以及(如果还没有注意到这种模式)第三个方程关于Fz。与引入新奇的抽象相比,一点冗余似乎更可取。⊃1;⁷

  汤姆森似乎没有意识到的是,以向量形式表达宇宙定律的方式迫使我们尊重似乎融入现实的对称性,而无需我们付出任何额外的努力。就其基本定律而言,我们的宇宙似乎是旋转对称的。物理学中没有首选轴,更不用说,相互垂直的三轴的首选轴了;如果我们写下随机的三组方程,那么这些方程的解几乎没有机会表现出我们所期望的旋转对称性。另一方面,如果我们以向量形式写下提出的定律,我们的向量方程可能无法描述宇宙,但由于向量的本质,它们将被迫表现出旋转对称性。

  举个例子,吉布斯和赫维赛德的向量语言不允许我们讨论,考虑由 [x,y,z] ◦ [x,y,z] = [xx,yy,zz] 定义的哈达玛积(Hadamard product)运算。从表面上看,这看起来像是两个向量的点积的足够自然的向量对应物;你可能会认为它可能对物理学有用,但事实并非如此。⊃1;⁸事实上,向量分析并没有给我们一种用吉布斯和赫维赛德的运算来表达这种运算的方法,乍一看似乎是一种负担,但它实际上是一种优势。哈达玛积不会出现在物理学(或欧几里得几何)中,所以我们应该庆幸我们的符号引导我们远离它。

  向量的抽象语言——加法语言和两种乘法(如果你算上用比例因子拉伸向量的那种,则为三种)——似乎是现实运算系统的一部分;如果我们想探究这一现实,我们必须学会以向量的方式说话和思考。向量概念为我们指明(双关语)了正确的方向。

  吉布斯-赫维赛德符号最终胜出(参见Stack Exchange上的帖子:点积和叉积的起源 ),因此麦克斯韦最初的 20 个控制电磁学的方程被精简为现在常用的4个方程。就在四元数和向量的争论逐渐平息之际,麦克斯韦方程组催生了爱因斯坦的狭义相对论,它以自己的方式为四元数论者的雄心壮志敲响了丧钟。哈密顿认为,他的三维加一维四元数(虚部的三维和实部的一维)具有深刻的启示,可以教给我们关于宇宙的三维空间和一维时间。爱因斯坦表明哈密顿既是对的,也是错的;空间和时间可以被看作是一个统一的整体,但哈密顿的时空在数学上与爱因斯坦的时空不同,后者是我们生活的时空。有趣的是,正数人和负数人之间的斗争得到了一个至今仍在闷闷燃烧的争论的呼应:爱因斯坦的时空(也称为闵可夫斯基空间)应该被视为具有三个正维和一个负维,还是具有三个负维和一个正维?⊃1;⁹

  将麦克斯韦与爱因斯坦联系起来的一个重要部分是,爱因斯坦和其他物理学家注意到麦克斯韦方程除了具有旋转对称性外,还表现出其他无法用相对论前的术语解释的对称性。这些对称性被称为洛伦兹变换,它们是导致爱因斯坦提出光速对于所有观察者必须相同的主要线索,即使该提议要求更新速度的概念(以及随之而来的空间和时间的概念)。

  爱因斯坦以一种具有讽刺意味和不经意的方式,在他随后的广义相对论发展中对向量事业做出了另一个贡献。为了表达他关于引力和几何学的想法,爱因斯坦需要比向量更抽象的东西,即张量(tensor)。一旦物理学家不得不掌握张量,他们无疑会重新认识到向量的相对简单性和具体性。(顺便问一句,你想知道是谁发明了“张量”这个词吗?又是哈密顿。)

  但爱因斯坦并不是第一个使用张量的物理学家。几十年来,材料科学家们已经使用它们来研究钢等材料中的应力。还记得莱布尼茨对情境几何学的愿景吗,这种几何学可以让人们计算出材料的质量?仅仅两个多世纪后,他试图让惠更斯对他的愿景感兴趣,他的愿景就变成了现实。

  至于莱布尼茨更雄心勃勃的梦想,即用神谕(oracle)来回答人类最紧迫的问题,目前尚不清楚我们离得有多近。我们曾经认为数字计算机(使用莱布尼茨倡导的二进制系统)将使人工智能成为可能。如今,我们使用这些二进制智能来模拟原理图的(schematic)大脑,并投入大量计算机能力来确定一个原理图的神经元与另一个原理图的神经元之间的连接权重,在此过程中使用向量数学。(有时“向量”只是一个意为“列表”的花哨的词,但深度学习的算法确实认真对待了多维空间的概念。)

  如今,许多人都希望当前的人工神经网络,或者它们在不久的将来的继任者,能够帮助解决医疗保健、环境、制造和教育领域的紧迫问题,甚至帮助我们回答基本的科学问题。但我们离莱布尼茨的“让我们计算吧!”的梦想还很遥远。可以肯定的是,当我们问人工智能一个问题时,它会给我们一个答案,但这是正确的答案吗?甚至是合理的吗?当我给 ChatGPT 提供 Endnote 4 中的几何问题,询问它线段 AF 和 FG 的比率时,它产生了一个轻率而自信的证明,即两个长度的比率是 −1,这不是任何两个长度的比率。

  所以现在,我们陷入了“让我们聊天”的阶段,值得记住的是,“聊天”的拉丁词是confabulare,一个不同的英语单词是从中衍生。

  这篇文章是我正在写的一本书第9章的草稿,暂定名为“数字可以是什么?加号和乘法的更远、更奇异的冒险”。如果你觉得这听起来很酷,并想帮助我把这本书做得更好,请查看 。和往常一样,请随时在 Mathematical Enchantments WordPress 网站上提交对这篇文章的评论!

  #1. 莱布尼茨写了 AB♉CD来表示线段AB与线段CD全等。然后,他将中心为 O 且半径为 OP 的球面定义为所有满足OQ♉OP的点Q的集合,将点A和点B之间的平面定义为所有满足AC♉BC的点C的集合。以此类推,用于直线、圆形、三角形等。

  #2. 数学家们(如果他们还记得他的话)对韦塞尔的记忆大多是,在高斯出生前几年,他就想出了如何使用平面上的点来表示复数,以及如何用几何方式表示复数的相加。鲜为人知的是,在发现了如何通过平行四边形定律将复数作为平面中的点相加后,韦塞尔意识到以类似的方式在三维中对点做加法没有任何障碍。韦塞尔将他的三维加法定律应用于球面三角学,这是导航中的重要工具。他于1797年在丹麦皇家学院提出了他的想法,并于1799年在该学会的主持下出版了一本回忆录。直到1897年,它才被遗忘。数学史学家迈克尔·克劳(Michael Crowe)在《向量分析史 A History of Vector Analysis》(我撰写本文时非常依赖他的著作)中这样描述韦塞尔的回忆录:“如果它被视为18世纪后期的创作,那么人们只能敬畏地看待它。”

  #3. 这里的“calculus”是旧意义上的,意思是一种计算方法,与莱布尼茨和牛顿的微分和积分无关。“Barycenter”是指“重心”或“质心”。

  #4. 例如,考虑以下问题:“给定一个三角形 ABC,点 D 绘制在 AB 边上,使 AD 的长度是 DB 的两倍,点 E 绘制在 AC 边上,因此 AE 的长度是 EC 的三倍。设点 F 为线段 BE 和 CD 的交点,设点 G 为线段 AF 和 BC 的交点。AF的长度与FG的长度之比是多少?要用质点几何来解决这个问题,不需要天才,甚至不需要大量的写作;质点专家可以画出下图(表示在 A 处放置 1 个质量单位,在 B 处放置 2 个质量单位,在 C 处放置 3 个质量单位),将问题的答案读为(2+3):1(比值为5比1),当不熟练者仍在挠头时继续下一个问题。要成为熟练者,请查看参考文献中列出的 Sitomer 和 Conrad 的文章。

  #5. 有关负砝码重量对莫比乌斯可能意味着什么的讨论,请参阅科学和数学史Stack Exchange的帖子,重心计算中的负系数 。

  #6. 19世纪的畅销书《精确科学常识》(Common Sense of the Exact Sciences)最初是一个个人项目,克利福德(Clifford)的目标是简化格拉斯曼(Grassmann)的思想,正如克利福德在1885年出版的一本更具技术性的书中阐述的那样。克利福德在项目过程中去世,由皮尔逊完成,他撰写了关于向量的章节。皮尔逊的“rho”(ρ)是他十年后推广的统计相关性的度量,可以解释为高维空间中两个向量之间夹角的余弦;有兴趣的读者可以在乔丹·艾伦伯格(Jordan Ellenberg)的21世纪畅销书《如何不犯错》(How Not To Be Wrong)的第15章中了解这种联系。

  #7. 一些读者可能会发现,回想一下高中经常教授的平行四边形面积的公式会有所帮助,该公式的顶点以笛卡尔坐标给出。具体来说,顶点为(0,0)、(a,b)、(c,d)和(a+c,b+d)的平行四边形具有面积ad−bc,前提是从(0,0)到(a,b)到(a+c,b+d)到(c,d)到(0,0)的闭合路径是逆时针方向;相反,如果路径是顺时针方向,则ad−bc是该面积的负值。在情况(a,b)=(1,0)和(c,d)=(0,1)(得出ad−bc=+1)和情况(a,b)=(0,1)和(c,d)=(1,0)(得出ad−bc=−1)的情况下,这是最容易看到的。

  #8. 如果你想知道考虑几何积的正确方法,请查看“双向量”(bivector)。如果你真的想成为技术性的,你应该知道平面上两步的几何积也不是一个有符号的数字,而是一维空间中的向量。

  #9. 考虑一个直角边为AB和AC(分别由步s和t表示)的直角三角形,如图所示。

  那么斜边对应于步s−t,所以斜边的平方长度为(s−t)·(s-t)。应用分配律几次,我们将其写为s·s − s·t − t·s + t·t。但是中间两项等于0(因为当s和t正交时,s·t=0),所以我们只剩下s·s加t·t,第一项是s长度的平方,第二项是t长度的平方,因此直角三角形斜边长的平方等于直角边长度的平方和。

  其中一个对角线由s+t给出,而另一个由s−t给出,因此对角线长度的平方和为(s+t)·(s+t) + (s−t)·(s−t)。如果我们使用分配律来展开它,我们会得到八项

  #11. 可以将n维空间中的点规定为实数n元组,使用线性积定义点之间的距离和线之间的角度,并使用几何积定义面积和体积。即使我们无法可视化这些空间中的对象,我们仍然可以使用格拉斯曼公式计算它们的性质。

  #12. 后来,哈密顿采用了更几何的四元数观点,并希望他能先呈现出对称的画面,而不是将i、j和k带入故事中。

  #14. 幸运的是,格拉斯曼在有生之年确实得到了认可,尽管直到他生命的最后几年才得到认可。

  #15. 麦克斯韦和他同时代的大多数人一样,对以太的看法是错误的,但他对波的看法是正确的。

  #16. 1903年成立了一个委员会,专门为向量分析选择最佳符号;委员会活动的唯一结果是产生了三种新的符号。

  #17. 有关汤姆森与向量的争吵的更多信息,请参阅Straight Dope帖子,为什么开尔文勋爵认为向量是无用的?

  #18. 要了解为什么Hadamard积在几何上不自然,请比较向量v=[1,1,1]和w=[√3,0,0]。有一个旋转将v带到w(因为v和w都是大小为√3的向量),因此这两个向量应该具有相同的属性;但v◦v=v,而w◦w≠w。因此,Hadamard积与点积和叉积不同,未表现出旋转对称性。换句话说:如果我们生活在一个哈达玛积是物理定律数学表达的基本成分的宇宙中,那么就必须有一个首选的坐标系。在我们的宇宙中不存在这样的框架。

  吴国祯教授:我的国外研究生经历印象——应清华大学物理系“基科班20年·学堂班10年纪念活动”而写

  《物理与工程》期刊是专注于物理教育教学研究的学术期刊,是中国科技核心期刊,1981年创刊,欢迎踊跃投稿,期刊投审稿采编平台:超越离合器迟滞回线柔轮长径比

-

文章分类

-