闲聊八卦,天南海北,随心所欲,直言不讳
头像
By kanting
贴子数 定制
#9423
罕见的陶哲轩(极长)访谈:数学、AI和给年轻人的建议

陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。

作为菲尔兹奖得主,陶哲轩一直被认为是当世最伟大的数学家之一,而这次在与MIT技术背景的播客大神Lex Fridman的对话,也是他近年来首次接受超3小时的非学术机构访谈,内容覆盖数学前沿、AI形式化验证、科研方法论等多个硬核议题。

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议

图片

不仅谈论分享了数学和物理相关的专业性观点,还结合当下AI技术迅速发展的背景,作出了很多像基础教育和AI应用的大众话题思考……

陶哲轩金句频出,比如:

AI和菲尔兹奖的距离,只差一个研究生了。
复数意义上的人类共同体将创造出最顶尖的超级智能体,比单个数学家更有可能实现数学领域的突破。
数学的关键在于不仅是找到一个有效的技术路径,而是在几十种可能适用的方法中排除错误答案。
科学通常是三者之间的相互作用:现实世界、我们对现实世界的观察,以及我们认为世界如何运作的模型。
在理解和看待世界的方式上,数学从公理出发关注模型,物理由结论驱动注重收集结果。
在AI的协助下,数学在未来将会有更多的实验,而不仅仅是理论。
数学之美在于你可以随心所欲地改变规则,这是其它任何领域都无法做到的一点。
解决困难问题就像香港动作片,逐个击破,方得大成。
……

陶哲轩认为,AI正在重塑人类科学范式,数学和物理的终极问题上,AI将成为人类探索这些范式的重要伙伴,但无法取代人类的直觉与创造力。

而关于数学,他也深入浅出地谈论了以下世界级数学难题——

Kakeya猜想
纳维-斯托克斯正则性问题
塞迈雷迪定理
万物理论
广义相对论
庞加莱猜想
孪生素数猜想
克拉兹猜想
黎曼假设
费马大定理
嗯,是的,这就是一次高智力、高密度和高强度的三高对话,如果你也做好了“大脑尖叫”的准备,一起来看看我们整理过的访谈全文吧~~

https://www.qbitai.com/2025/06/299860.html
头像
By kanting
贴子数 定制
#9424
罕见的陶哲轩(极长)访谈

片段


Q:你是在什么时候意识到数学可以有一种优雅和美感的?

陶哲轩:当我来到普林斯顿读研究生时,John Conway当时也在那里,他于几年前去世了。但我记得我参加的最早的研究讲座之一,就是Conway关于他的极端证明的报告。

Conway会以一种你通常不会想到的方式思考各种事物,他认为证明本身就占据了某种空间,所以如果你想证明某件事,比如说有无限多个素数,你可以把它们放到不同的轴上。

有些证明是优雅的,有些证明很长,有些证明是初级的。这样就有了证明空间,且空间本身具有某种形状。他对形状的极值点很感兴趣,比如在所有证明中,什么是以牺牲其他一切为代价的最短证明?或者什么是最初等的证明?或者其它。

所以他列举了一些著名定理的例子,然后他会给出他认为是这些定理的极端证明。这真的让人大开眼界,这不仅是得到一个有趣的结果证明,而且一旦你有了这个证明,试图用各种方式优化它,证明本身就拥有了一些技巧。

这也影响了我的写作风格。比如当你做本科数学作业时,你被鼓励写下任何有效的证明并交上去,得到一个勾,你就继续前进。

但如果你希望你的结果真正具有影响力并被人们阅读,它就不能只是正确的。它也应该让阅读成为一种享受,才能有动力推广到其他事物。

这和许多其他学科一样,比如像编码。数学和编码之间有很多类比。就像你可以用意大利面条式代码编写一些东西,它适用于某个任务,又快又脏而且高效。但其实有很多可以写好代码的好原则,这样其他人就可以使用它,并在此基础上构建,减少错误的发生,数学也有类似的事情。

另外还有一种叫做代码高尔夫的活动,我也觉得它美丽而有趣。人们使用不同的编程语言,来试图写出完成特定任务的最短程序。我甚至相信这里存在一个比赛,不仅可以对程序进行压力测试,还可以对证明或者不同语言进行测试。也许这是一种不同的符号,用以完成不同的任务。

Lex Fridman:你觉得数学中最美丽或最优雅的方程是什么?欧拉恒等式常被认为是数学中最美丽的方程,你是否在那个方程式中,在欧拉恒等式中找到了美?

陶哲轩:我来说的话,我觉得最吸引人的是不同事物之间的联系,欧拉恒等式使用了所有的基本常数,这很可爱。但对我来说,指数函数是欧拉引入来测量指数增长的,所以复利或衰减,任何持续增长、持续减少、膨胀或收缩的东西,都可以用指数函数建模。

而π来自圆和旋转,如果你想转一根针180度,你需要旋转π弧度。而i复数表示虚轴上的摆动,对应90度的旋转,所以是方向上的改变。所以指数函数代表当前方向上的增长和衰减。当你在指数中加入i时,它现在变成与当前位置成直角的运动。

然后欧拉恒等式将告诉你,如果你旋转一个时间π,你最终会得到另一个方向。它将通过复化和i的旋转,将所有数学工具统一起来,包含数学、动力学、几何和复数。

而当你第一次研究任何东西时,你必须测量事物并为它们命名,有时因为模型与现实相去甚远,也会给错误的东西起了好名字,但直到后来你才发现什么是真正重要的东西。

例如在物理学中,E=MC²,其中一件大事就是E,而当亚里士多德首次提出运动定律,然后是伽利略或牛顿能测量质量、加速度、力等等,所以有了著名的牛顿第二运动定律F=ma。因为这些是主要对象,所以它们被赋予理论中的核心位置。

直到后来人们开始分析这些方程,才发现似乎这些量总是守恒的,特别是动量和能量。而事物是否拥有能量,这并不明显,能量它不像质量、速度那样可以直接测量,但随着时间推移,人们逐渐意识到这实际上是一个非常基本的概念。

哈密顿最终在19世纪将牛顿物理定律重新表述为哈密顿力学,其中能量,也就是哈密顿量是主导对象,一旦你知道如何测量任何系统的哈密顿量,你就能完全描述动力学,即所有状态会发生什么。

它作为核心角色,起初也并不明显,而当量子力学出现时,视角的转变则提供了很大的帮助。研究量子力学的早期物理学家,他们首先尝试将牛顿力学融入量子力学,但遇到了很多麻烦,因为一切都是粒子,而我认为它是波,总之结合起来非常奇怪。

如果你问,F=ma的量子版本是什么,这很难回答。但事实证明,在经典力学背后的哈密顿量也是量子力学的关键对象,这里也有一个叫做哈密顿算符的对象。它是一种不同类型的对象,是运算符而不是函数,但一旦指定了它,你就指定了整个动力学。

所以这里有一个叫做薛定谔方程的东西,它可以准确地告诉你,一旦你拥有哈密顿量,量子系统将会如何演变。

所以将二者放在一起,看起来是完全不同的对象,一个涉及粒子,一个涉及波。但有了中心性,就可以将很多直觉和事实从经典力学转移到量子力学。

例如,在经典力学中,有一个叫做诺特定理的东西。每当物理系统中存在对称性,就有出现守恒定律。所以物理定律是平移不变的。

比如如果我向左移动10步,我会体验到与初始位置相同的物理定律,这对应动量守恒。而如果我以某个角度转身,我又将再次体验到相同的物理定律。这对应角动量守恒。如果我等待10分钟,我仍然有相同的物理定律,由于存在时间平移不变性,这对应能量守恒定律。

所以在对称性和守恒之间存在这种基本联系,这在量子力学中也成立。尽管方程完全不同,但因为它们都源于哈密顿量,哈密顿量控制一切。当每次哈密顿量具有对称性时,方程就会有一个守恒定律。所以一旦你拥有正确的表述,很多事情都变得清晰起来。

我们无法统一量子力学和广义相对论,因为我们还没有弄清楚基本对象是什么,例如我们必须放弃空间和时间的概念,因为这些空间几乎是欧几里得类型,只在非常小的尺度上出现量子涨落,从而形成时空泡沫,试图用笛卡尔坐标xyz解释是行不通的,但我们还不知道用什么来代替它。我们没有类似于哈密顿量能组织起一切的类似数学概念。
头像
By kanting
贴子数 定制
#9425
罕见的陶哲轩(极长)访谈

片段

庞加莱猜想:想象一个被揉皱并扭曲的球
Q:Grigori Perelman在七年时间里几乎不与外界接触,独自解决了庞加莱猜想,这是个什么问题?也许再谈谈Grigori Perelman的这段经历?

陶哲轩:好的,这是一个关于弯曲空间的问题,地球就是一个很好的例子。你可以想象一个二维曲面,它可能是一个带洞的环面,也可能有很多洞,而且表面可能有多种先验拓扑结构,即使你假设它是有界的、光滑的等等。我们已经弄清楚了如何对曲面进行分类,初步近似地看,一切都由一种被称为亏格的属性决定,即这个曲面上有多少个洞:球体的亏格为0,环面的亏格为1,以此类推。

区分这些二维曲面的一种方法是,球体具有一种被称为单连通性的特性,意味着如果你在球体上取任何闭合环路,它都可以被收缩成一个点,同时保持在曲面上,而环面并不具备这种性质。如果你在一个环面的外部取一根绕着环面的绳索,它无法通过环面的那个洞,也就没有办法闭合并收缩成一个点。球体是唯一具有这种可收缩性性质的曲面,直到球面经过连续变形。这就是我想称之为与球面拓扑等价的物体。

图片

庞加莱在更高的维度上提出了相同的问题,但这变得难以可视化,因为你可以在三维空间中想象一个曲面,但作为一个弯曲的自由空间,我们对四维空间没有很好的直观理解,无法将三维空间嵌入到四维空间中,我们需要五个、六个甚至更高维度的空间。但无论如何,从数学上讲,你仍然可以提出这个问题:如果你有一个有界的三维空间,它还具有这个单连通的性质,即每一个闭合曲线都可以收缩,你能把它变成一个三维球体的版本吗?这就是庞加莱猜想。

奇怪的是,在四维、五维甚至更高维度上,这个问题反而更容易解决——它首先在更高的维度上得到了解决——可能是因为某种程度上,它有更多的空间来变形,更容易把事物变成一个球体。但三维情况下真的很难,人们尝试了多种方法,比如说某种剖分方法,把曲面分割成小三角形或四面体,然后根据这些面面如何相互作用来进行推导;或者也有代数方法,使用各种代数对象,比如所谓的“基本群”,你可以将它们附加到同调、上同调、以及所有这些非常高级的工具上。它们也没能完全奏效。

但是Richard Hamilton提出了一个微偏分方程(PDE)的方法,问题是这样的,你有一个球体,但它的呈现方式非常的奇怪:想象一个被揉皱并扭曲的球,让人看不出来那是个球。如果你有一个某种意义上是变形球体的曲面,你可以将它想象成一个气球,试着给它充气,随着空气的注入,它的皱纹会被抚平,就变成了一个漂亮的球体;但如果它是个环面或者类似的东西,它就会在某个点卡住。当内环收缩到零时,中间会得到一个奇点,并且无法再继续膨胀或者流动了。Richard Hamilton创造了这个流程,现在被称为里奇流(Ricci flow),这是一种把任意曲面或空间平滑化、变得越来越圆的方法,让它看起来像个球体。这个过程要么会形成一个球体,要么就产生一个奇点。就像是偏微分方程,它们要么具有全局规划性,要么就具有有限时间爆炸性,基本上这几乎是完全相同的事情。一切都是相互关联的。

Richard Hamilton指出,对于二维曲面,如果能保持永不形成奇点,就永远不会遇到麻烦,它会一直流动,并且形成一个球体,于是他得到了二维结果的一个新的证明。

Lex Fridman:这是一个很棒的解释,对于里奇流及其在此背景下的应用。对于2D情况来说,这里的数学有多难?

陶哲轩:这些是非常复杂的方程,与爱因斯坦方程不相上下,额,略微简单一些,但它们被认为是难以求解的非线性方程。2D中有很多特殊技巧可以提供帮助,但问题在于,在3D中这个方程实际上是超临界(supercritical )的。与纳维-斯托克斯方程相同的问题,随着爆发性增长,曲率可能会集中在越来越小的区域,并且看起来越来越非线性,情况变得越来越糟。

图片

△纳维-斯托克斯方程的一般形式
可能会出现各种各样的奇点,其中一些可能存在于那些被称为“脖子夹”(neck pinchers)的、表面像杠铃一样的地方,并且在某一点收缩;有些奇点足够简单,你可以从中间剪开,然后就能把一个表面变成两个,并分别演化它们;但也存在这样的可能性:会出现一种非常棘手的像打了结一样的奇点,没办法对它进行任何“手术”。所以就需要对所有的奇点进行分类,比如知道事情可能会出错的所有方法是什么。

Perelman首先做的是把问题从超临界问题过渡到临界问题,像我之前说过能源的发明,哈密顿量阐明了牛顿力学。他介绍了一些概念,现在称为佩雷尔曼减少体积(Perelman’s reduced volume)以及佩雷尔曼的熵(Perelman’s entropy),并引入了新的量,比如能量,这些量在每个尺度上都保持一致。非线性实际上突然看起来不再像以前那么可怕了。

图片

△Grisha Perelman证明庞加莱猜想的论文

他仍然需要分析奇点这一关键问题——这本身也是一个类似的问题——就难度上,和我所研究的波映射问题相当。所以Perelman设法对所有奇点进行了分类,并展示如何对每种情况进行处理。通过这种方式,他解决了庞加莱猜想。这包含了很多雄心勃勃的举措,今天的大语言模型都没办法做到。我的意思是,我充其量只能想象一个模型会将这个想法在数百种尝试方案中提出,但除此之外的99个将会是彻底的死路一条,而你只有在经过几个月的工作之后才能发现。Perelman肯定感觉到这是正确的道路才会去追求,因为从A到B要花费好几年的时间。
头像
By kanting
贴子数 定制
#9426
罕见的陶哲轩(极长)访谈

片段


Q:仅从心理因素来看,你有没有产生过最让你感到无措的自我怀疑?

Lex Fridman:感觉数学实在是太令人着迷了,当你在某个问题上投入太多精力但结果却是错误的时候,它可能会击溃你。就像是,国际象棋也击溃了一些人。

陶哲轩:我认为不同的数学家对数学有着不同的情感投入程度,有些人认为这只是个工作,你遇到了问题,你可以不解决,而是继续下一个,所以你总是可以继续投入另一个问题,这减少了情感上的联系。还有一些情况会产生一些被称为数学病的问题,就是他们会只抓住那个问题不放,花费数年只思考那个问题,即使他们的职业生涯会因此受损。但他们说:“好吧,但这是个大突破,一旦我解决了这个问题,它将弥补所有失去机会的岁月。”这种心态偶尔确实有效,但我讲真不推荐给没有毅力的人。

我从来没有对任何一个问题投入过多精力,一个帮助我们的点是,我们不需要提前明确我们的问题。当我们提交研究提案时,我们会说我们将研究这一系列问题,但即使我们不确定五年内我肯定会提供所有这些问题的证明,而是承诺取得一些进展或发现一些有趣的现象。也许你没能解决那个问题,但你发现了一个相关的、你可以对其说些新东西的问题,而那是一个更可行的任务。
头像
By kanting
贴子数 定制
#9427
罕见的陶哲轩(极长)访谈

片段


Q:有没有一个一直困扰着你们的问题?像孪生素数猜想、黎曼猜想、克拉兹猜想?

陶哲轩:孪生素数,听起来……好吧,再说,我的意思是,像黎曼猜想一样,那真是遥不可及,甚至完全没有可行的途径。即使我使用了所有我知道的作弊手段,在这个问题里也依然无法从A到B。我认为首先需要在数学的其他领域取得突破,然后有人要认识到那个突破是可以运用于这个问题的。

Lex Fridman:所以我们应该后退一步,只讨论素数。它们通常被称为数学的原子。你能谈谈这些原子提供的结构吗?

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
陶哲轩:自然数有两种基本运算:加法和乘法。所以如果你想生成自然数,你可以做两件事之一:你可以从1开始,一次次地加1,这样就生成了自然数,所以从加法角度看,它们很容易生成1、2、3、4、5;或者你可以取质数,如果你想从乘法角度生成,你可以取所有质数,2、3、5、7,然后把它们全部乘在一起。这样你就得到可能除了1以外所有自然数。所以从加法和乘法角度看,自然数有两种不同的思考方式。单独来看,它们都不算太难,关于自然数的任何问题,如果是只涉及加法或乘法的,都相对容易解决。

令人沮丧的是,当你把这两者结合起来,问题忽然就变得极其丰富……我的意思是,我们知道数论中有一些命题实际上是不可判定的。像是某些多元多项式方程是否存在自然数解的问题,它们的答案取决于数学基础命题的不可判定性——比如数学公理本身的一致性。

但即使是最简单的问题,把一些乘法和加法运算结合起来,比如在素数上做一些附加操作,像是移动2位。分别来说我们都很了解,但如果你问当你平移一个素数两位时,能否得到一个另素数?或者你能多久得到另一个素数?将两者联系起来竟然变得如此困难。

Lex Fridman:孪生素数猜想就是这样的,它假设存在无限多对相差为2的素数。有趣的是,你在回答这些种类繁多的复杂问题时取得了非常成功的进展,比如你提到的格林-陶定理,它证明了素数序列包含任意长的等差数列。你能证明出这样的定理,真是令人难以置信。

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
陶哲轩:是的。所以我们意识到,这种类型研究的重点是不同的模式具有不同级别的不可摧毁性。孪生素数问题的难点在于,如果你把世界上所有的素数都列出来,3、5、7、11 等等,其中有一些是成对的,比如 11 和 13 是一对孪生素数,还有其他孪生素数等等。如果你愿意的话,你可以轻松地编辑素数以摆脱这些孪生素数。虽然孪生素数是无穷多的,但它们在素数里实际上相当稀疏,一开始确实有不少,但一旦到了数百万、数万亿级别,它们就变得越来越稀少。实际上,如果有人能够访问素数数据库,他们只需在这里或那里删除几个素数,就可以让孪生素数猜想成为错误。只需要删除0.01%的素数或者类似的什么,真是明智之举。

因此,你可以提供一个经过审查的素数数据库,它通过所有关于素数的统计测试、遵循多项式定理和其他质数效应,但不再包含任何孪生素数。这对于孪生素数猜想来说是一个真正的障碍,意味着任何旨在在实际素数中找到孪生素数的证明策略,在应用于这些稍作修改的素数时都必须失败。因此,这必定是素数中某种非常微妙、精细的特征,而不仅仅是通过整体统计分析就能得到的。

另一方面,算术级数被证明要稳健得多。你可以取素数,实际上可以排除 99%的素数,你可以选择任意90个参与者。结果发现,我们另一个证明是,你仍然可以得到算术级数。算术级数非常多,它们就像蟑螂一样。

Lex Fridman:对于不了解的人来说,算术级数是一系列相差某个固定值的数。

陶哲轩:是的。但它又像是那种无限猴子现象(一只猴子在无限时间内随机独立地敲击打字机键盘上的按键,几乎肯定会打出任何给定的文本),对于任何固定长度的集合,你不会得到任意长度的进展,只会得到相当短的进展。

Lex Fridman:但你说孪生素数不是无限猴子现象。我的意思是,这是一只非常狡猾的猴子,但它仍然是一种无限猴子现象。

陶哲轩:如果素数真的是随机的,这些素数是由猴子生成的,那么事实上无限猴子定理就是这样的。

Lex Fridman:但你说是孪生素数,你不能使用同样的工具。它看起来几乎不是随机的。

陶哲轩:嗯,我们不知道。我们相信素数的表现像是一个随机集合。所以我们关心孪生素数猜想的原因,是一个测试案例,测试我们是否能够真正地、自信地、假设错误率为0%,说素数表现得像是一个随机集合。我们已知的素数的随机版本至少有100%的概率包含孪生素数,或者随着你越来越向外延伸,概率趋于 100%。所以,我们相信素数是随机的。算术级数之所以不可摧毁,是因为无论它看起来是随机的还是周期性的结构,在这两种情况下,算术级数都会出现,但原因不同。这就是这个定理的基本原理,有很多证据都证明了算术级数定理,它们都通过某种二分法得到证明:即你的集合要么是结构化的,要么是随机的,在两种情况下你都可以说些什么,然后你把两者结合起来。

但在孪生素数中,如果素数是随机的,那么你很高兴,你就赢了。如果素数是结构化的,它们能够以一种特定的方式结构化并消除孪生素数。我们不能排除这个阴谋。

Lex Fridman:但据我了解,你可以做到在K元组(K-tuple)版本上取得进展。

陶哲轩:是的。所以关于阴谋的一个有趣之处是,任何一个阴谋理论都很难被证伪。如果你相信世界是由蜥蜴统治的,你会说“那么这里有一些证据表明它不是由蜥蜴统治的。”嗯,但是那个证据也是蜥蜴的阴谋,你可能遇到过这种情况。几乎没有办法可以明确排除阴谋,在数学上也是如此,一个完全致力于消除孪生素数的阴谋还必须渗透到数学的其他领域,但至少据我们所知,它可以保持一致。但有一个奇怪的现象,你可以用一个阴谋排除其他阴谋。所以如果世界是由蜥蜴统治的,它就不能同时是由外星人统治的,对吧?

所以一个不合理的事情很难被证伪,但多个不合理的事情就有工具了。比如我们知道存在无限多个素数,其中任意两个素数的差值不超过……实际上,这个数字最高是246,存在一个界限。所以有孪生素数;有一种东西叫做表亲素数(cousin primes),它们的差值为4;还有相差6的性感素数(sexy primes)——这个概念远没有其名称所暗示的那么令人兴奋。

你可以排除其中一个阴谋,可一旦你有 50 个阴谋,事实证明,你无法一次性排除所有的可能性。这需要这个阴谋空间里太多的能量。

Q:你是怎么做界限部分的?你是怎么为不同的素数发展界限的?

陶哲轩:所以这最终是基于一个被称为鸽巢原理(the pigeonhole principle)的东西。鸽巢原理就是,如果你有若干只鸽子,并且它们都必须进入鸽巢,而鸽子数量多于鸽巢数量,那么至少有一个鸽巢里必须有至少两只鸽子。所以必定有两只鸽子彼此距离很近。比如,如果你有 100 个数字,它们都介于 1 到 1000 之间,那么其中两个数字之间的距离最多为 10,因为你可以将 1 到 100 的数字分成 100 个鸽巢。假设你有 101 个数字,那么这 101 个数字中必定有两个数字之间的距离小于 10,因为这两个数字必须属于同一个鸽巢。这是数学基本原理的基本特征。

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
鸽巢原理不能直接和素数一起使用,因为素数在向外延伸时会变得越来越稀疏,也就是说质数会变得越来越少。但事实证明,有一种方法可以给数字分配权重。有些数字算是准素数(almost primes ),但它们并非没有除了自身和1以外的任何其他因数,只不过它们拥有的因数非常少。事实证明,我们对准素数比素数理解得更透彻。例如人们很早就知道存在孪生素数,这个问题已经被研究透了。所以准素数是我们能够理解的东西。因此,你实际上可以将注意力集中在合适的准素数集合上。素数相对来讲非常稀疏,相比之下,准素数的稀疏程度要低得多。

你可以构建一个准素数的集合,其中素数的密度大约是 1%,这能让你有机会通过应用某种鸽巢原理来证明大约只有100个素数。但为了证明孪生素数猜想,你需要获得素数的密度,在准素数内几乎达到50%的阈值,一旦达到 50%,你就会得到孪生素数。但不幸的是,无论你选择多么好的准素数集合,素数的密度永远不会超过 50%,这就是所谓的“奇偶性壁垒”(the parity barrier)。我非常想攻克它,所以,我长远的梦想之一是就找到一种方法来突破这个障碍,因为这将不仅解开孪生素数猜想,还能解开克拉兹猜想,和许多数论领域正在受阻的其它问题。因为我们的现有技术需要超越这个理论上的“奇偶性壁垒”,就像试图超光速行驶一样。

Lex Fridman:所以我们应该说孪生素数猜想是数学史上最大的问题之一,克拉兹猜想也是,它们感觉像是邻居。有没有哪天你觉得自己看到了解法?

陶哲轩:有的。有时你尝试某种方法,它就会非常有效,你就会感受到像我们之前谈到的数学气味(mathematical smell)。当事情进展顺利时,你会从经验中学习,因为有一些困难是不得不去遭遇的。我的一位同事可能会这样表达:如果你在纽约街头被蒙上眼睛放进车里,在几个小时后,你的眼罩被摘掉,发现你到了北京。我的意思是,这有点太容易了,不知道为什么并没有跨越海洋,即使你不知道具体发生了什么,你会怀疑有些事情不对劲。

Lex Fridman:但这仍然在你脑海中,你是否每次都会回到素数领域看一会儿?

陶哲轩:是的,在我没什么其他事情可做的时候——这种情况越来越少了,我现在有很多事情要处理——但当我有空闲时间,又不想做我的实际研究项目,也不想处理行政事务,或者不想为家人做些差事,我可以玩这些有趣的东西。通常情况下什么也得不到,你必须学会说:“好吧,再试一次,什么都没发生,我会继续前进。”偶尔我也会解决这些问题,或者有时就像你说的,你以为你解决了问题,然后你继续研究可能 15 分钟,然后你想到,“我应该检查一下,这简单得有点令人难以置信了。”通常都是这样。

Lex Fridman:关于孪生素数和克拉兹猜想这些问题的解决时间,你的直觉是怎么看的?

陶哲轩:关于孪生素数,我认为我们将会不断获得更多进展。这确实至少需要10年,这个“奇偶性壁垒”是剩下的最大的难题,有更简单的版本,我们已经非常接近这个猜想了。所以我认为在 10 年内我们将会有更多更接近的结果,但可能不会得到全部。孪生素数问题相对接近,但黎曼猜想,我一点头绪也没有,我的意思是,我想这是偶然发生的。

Lex Fridman:所以黎曼猜想是关于素数分布的更普遍的猜想,是吧?

陶哲轩:是的。这表明,在某种程度上只从乘性角度来看,对于只涉及乘法不涉及加法的问题,质数确实表现得像你希望的那样随机。

概率中存在一个现象称为平方根抵消(square root cancellation),如果你想要调查美国民众对某个问题的看法,并且只询问一两个选民,你可能会抽到一个糟糕的样本,然后你会得到一个对整体平均值的非常不精确的测量。但如果你抽样的人数越来越多,准确性就会越来越好,并且准确性随着你抽样人数的平方根而提高。如果你抽样 1,000 人,你可以得到 2%或 3%的误差范围。在同样的意义上,如果你以某种乘法性方式测量质数,你可以测量某种类型的统计数据,它被称为黎曼zeta函数,并且上下波动。

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
但从某种意义上说,随着你不断取更多平均值、不断进行更多采样,波动应该会像随机变量一样减小。并且有一种非常精确的方法来量化这一点。

黎曼猜想以一种非常优雅的方式捕捉了这一点,但就像数学中的许多其他方法一样,我们几乎没有工具来证明某件事真的表现得非常随机。这实际上不仅仅是一点点随机,但这种平方根抵消要求其行为像一个真正随机的集合一样随机。我们知道,对于与奇偶性校验问题有关的事情,大多数的常用技术都无法解决。证明必须出乎意料,但没有人提出过任何严肃的提议。正如我所说,有很多种方法可以解决,你可以稍微修改一下质数,就可以破坏黎曼猜想。它必须非常精细、你不能应用具有巨大误差范围的东西、它必须能够勉强工作,所有的这些陷阱你都会遇到并且非常娴熟地躲避。

Q:对你来说,素数最神秘的是什么?

陶哲轩:这是个好问题,从推测上来说,我们对素数有一个很好的模型。我的意思是它们具有某些规律,比如质数通常是奇数。但除了存在一些明显的规律外,它们表现得非常随机,只是假设它们会这样表现。

所以有一个称为 Cramér质数随机模型的东西,在某个时间点之后,素数的表现就像一个随机集合。这个模型还有各种细微的修改,但这是一个非常好的模型,它与数值相匹配,并告诉我们应该预测什么。就像是我告诉你可以完全肯定孪生素数猜想是正确的。随机模型给出了极高的准确性,我只是无法证明这一点。我们的数学大多是为了解决包含规律的问题而优化的。而质数存在这种反模式,实际上几乎所有事物都是这样,但我们无法证明这一点。

我想质数是随机的并不神秘,因为它们没有必要有任何秘密模式。但神秘的是,究竟是什么机制真正迫使随机性发生?这一点完全缺失。
头像
By kanting
贴子数 定制
#9428
罕见的陶哲轩(极长)访谈

片段

Q:你提到你也在普林斯顿大学。当时Andrew Wiles也在那里当教授,他宣布证明了费马大定理。现在回过头来看,有了更多关于那个数学历史时刻的背景,你当时是怎么想的?

陶哲轩:嗯,当时我是研究生。我依稀记得当时有媒体报道,我们的信箱都在同一个邮件室,突然Andrew Wiles的信箱里塞满了信件。

我们都在茶话会上讨论过,但我们不明白。我们大多数人基本上没理解那个证明,我们理解的是高层细节。事实上,Kevin Buzzard有一个正在进行的项目要在 Lean 中形式化它。

Lex Fridman:我们能稍微偏离一下主题吗?那有多难?因为据我所知,费马大定理的证明涉及非常复杂的东西。

陶哲轩:是的,现在要将其形式化真的很难。他们使用的对象是可以定义的,他们已经在 Lean 中定义过了,所以定义是可以做到的。这确实不是件简单的事,但它已经完成了。但是关于这些对象还有很多非常基本的事实,在所有这些不同的数学论文中花了数十年时间才得以证明,所有这些都需要形式化。

Kevin Buzzard有一个为期五年的资助来形式化费马大定理,他的目标是他认为自己可能无法一直追溯到基本公理,但他希望形式化到只需要依赖黑盒,即当时一些理论家在 1980 年就已经知道的东西,然后其他人或其他工作可以从那里继续进行。

这与我所熟悉的数学领域不同。在我研究的分析学中,我们研究的对象更贴近基础。我研究像素数、函数等至少在高中数学教育范围内可以定义的东西。但随后,数论中存在一个非常高级的代数分支,人们已经在这个领域构建了结构,而且是一个非常稳固的结构。至少在基础层面,它已经非常成熟,有相应的教科书等等。

但确实存在这样的情况:如果你没有经过这些年的学习,而想了解这个结构的第六层在发生什么,你必须花费大量时间,他们才能让你达到能够看到你所熟悉的东西的程度。

Lex Fridman:关于Andrew Wiles的经历,有哪些方面让你感到启发,正如我们之前谈论的,他七年的大部分时间都是秘密工作?

陶哲轩:这多少符合人们对数学家浪漫化的想象,在人们把数学家都想象成这些有点古怪的法师之类的人物时,这确实加强了这种观点。他做出了伟大的成就,而且他解决问题的风格与我自己的风格非常不同,这很棒。我们需要这样的人。

Lex Fridman:你能谈谈这个么?比如在合作方面?

陶哲轩:如果一个问题太难,我就喜欢放弃,但我们需要那些有毅力和无畏精神的人。我曾与这样的人合作,我想放弃,因为我们尝试的第一个方法没有成功,第二个也没有成功。但他们坚信,并且有第三、第四和第五个方法,最终成功了。而我不得不承认,“好吧,我原本认为这不会成功,但没错,你一直是对的。”
头像
By kanting
贴子数 定制
#9429
【人工智能】AI时代下的数学变革 | 菲尔兹奖得主陶哲轩 | 挂谷问题 | 纳维-斯托克斯方程 | 流体计算机 | AI缺少数学嗅觉 | 形式化证明LEAN | 孪生素数 | 黎曼猜想 | 永恒追问


史上最伟大的数学家 | 陶哲轩和莱克斯·弗里德曼
头像
By kanting
贴子数 定制
#9439
科学家发现,极少数女性拥有一种罕见的视觉能力:她们的视网膜中并非只有三种感光细胞(视锥细胞),而是多了一种,成为“四色视者”(tetrachromat)。相比我们常人的“三色视觉”(trichromacy),这第四种视锥细胞极大扩展了她们感知颜色的能力,可能让她们看到我们从未察觉的细微色差。


  这种“第四种感光细胞”来源于X染色体上某个长波长色素基因的突变,它让视网膜对光谱的感应范围发生了变化。不过,对于这些女性来说,自己看到的颜色就是“正常”的,她们甚至未必意识到自己与众不同。


  第一个被科学确认的四色视者,是1993年一位英国社会工作者。别人眼里一道彩虹不过五种颜色,而她却能分辨出十种。
  华盛顿大学的色彩视觉研究者Jay Neitz估计,全世界大约有2%到3%的女性可能具备四色视觉。根据他对色觉的解释,人类视网膜中蓝、绿、红三种视锥细胞各能识别约100种色调,而大脑将这些组合之后,可识别约一百万种颜色。如果多出一种视锥细胞——大约位于红绿之间、接近橙色的位置——理论上,这一额外的100种色调会让她们的色彩感知能力达到一亿种。

  2001年,Ryan Sutherland在论文《我们中间的异类:人类超感四色视觉初步研究》中提出一个问题:“成为四色视者,是怎样一种体验?”

  他的回答是:在如今的世界,可能并不轻松。

  多数四色视者根本不知道自己的视觉有什么特别,而整个社会也未曾为这种能力做好准备。屏幕、相机、打印机、服装染料、绘画颜料——几乎所有颜色载体,都是按照“三色视觉”的标准设计的。在四色视者眼里,这些颜色往往“失真”,甚至不协调。

  但这项天赋也带来了可能性。科学家Gabriele Jordan提出,四色视者可能更擅长分辨皮肤色调,比如能第一时间察觉自己孩子是否脸色泛红或变得苍白。

  她们或许也能完美匹配色彩,胜任艺术品鉴定、色差比对、甚至彩妆与诊断等对色觉要求极高的职业。在心理层面,她们还能从肤色中看出情绪变化,甚至识别微妙的撒谎迹象。

这个世界上,真的存在“变种”人类

图片


  更令人惊讶的是,如果她们的红色感光细胞波长略微延伸进入红外范围,那她们也许还具备轻微的“夜视”能力,甚至能隐约感知人体热量,像猫一样在黑暗中“看见”世界。

  这些隐藏在人群中的四色视女性,就像是未被觉察的超级感知者。她们的世界,也许比我们看到的多了无数个维度。