陶哲轩丨什么是好的数学？

2019 年 5 月 22 日 乌镇智库

作者，陶哲轩，美国加州大学洛杉矶分校数学教授，2006年菲尔兹奖得主。

翻译，卢昌海，科普作家。

原文发表于group blog "Noncommutative Geometry" ，标题为 “Good Mathematics?”)

译者序：本文译自澳大利亚数学家 Terence Tao 的近作 “What is Good Mathematics?”。Tao是调和分析、微分方程、组合数学、解析数论等领域的大师级的年轻高手。2006 年， 31 岁的 Tao 获得了数学界的最高奖 Fields 奖，成为该奖项七十年来最年轻的获奖者之一。美国数学学会 (AMS) 对 Tao 的评价是：“他将精纯的技巧、超凡入圣的独创及令人惊讶的自然观点融为一体”。著名数学家Charles Fefferman (1978 年的 Fields 奖得主) 的评价则是：“如果你有解决不了的问题，那么找到出路的办法之一就是引起 Terence Tao 的兴趣”。

Tao 虽然已经具有了世界性的声誉，但由于他的年轻，多数人 (尤其是数学界以外的人) 对他的了解仍很有限。Tao 的这篇短文在一定程度上阐述了他的数学观，在这一点上类似于英国数学家 Godfrey Hardy 的名著《A Mathematician's Apology》，相信会让许多读者感兴趣 (如果哪位读者想接受 Fefferman 的忠告，让自己的问题有朝一日引起 Tao 的兴趣，那么读一读这篇文章可能会有所助益。不过 Tao 的这篇文章远比《A Mathematician's Apology》难读得多。从表面上看，它不带任何数学公式，这点甚至比《A Mathematician's Apology》做得更为彻底 (后者还带有一些 12+12=2 之类的数学公式)，但实际上，文章的主要部分 - 即第二节 (对应于译文中篇的全部及下篇的大部分) - 所涉及的数学概念相当密集，足以给非数学专业的读者造成很大的困难，因此译文对译者知识所及且能用简短方式加以说明的若干概念进行了注释。本译文略去了原文的摘要、文献及正文中单纯与文献有关的个别文句 (即诸如 “感兴趣的读者请参阅某某文献” 之类的文句)。本译文末尾附有 Alain Connes (1982 年的 Fields 奖得主) 在一篇 blog 文字中对 Tao 这篇文章的评论。

数学品质的诸多方面

我们都认为数学家应该努力创造好数学。但 “好数学” 该如何定义？甚至是否该斗胆试图加以定义呢？让我们先考虑前一个问题。我们几乎立刻能够意识到有许多不同种类的数学都可以被称为是 “好” 的。比方说， “好数学” 可以指 (不分先后顺序)：

好的数学题解 (比如在一个重要数学问题上的重大突破)；

好的数学技巧 (比如对现有方法的精湛运用，或发展新的工具)；

好的数学理论 (比如系统性地统一或推广一系列现有结果的概念框架或符号选择)；

好的数学洞察 (比如一个重要的概念简化，或对一个统一的原理、启示、类比或主题的实现)；

好的数学发现 (比如对一个出人意料、引人入胜的新的数学现象、关联或反例的揭示)；

好的数学应用 (比如应用于物理、工程、计算机科学、统计等领域的重要问题，或将一个数学领域的结果应用于另一个数学领域)；

好的数学展示 (比如对新近数学课题的详尽而广博的概览，或一个清晰而动机合理的论证)；

好的数学教学 (比如能让他人更有效地学习及研究数学的讲义或写作风格，或对数学教育的贡献)；

好的数学远见 (比如富有成效的长远计划或猜想)；

好的数学品味 (比如自身有趣且对重要课题、主题或问题有影响的研究目标)；

好的数学公关 (比如向非数学家或另一个领域的数学家有效地展示数学成就)；

好的元数学 (比如数学基础、哲学、历史、学识或实践方面的进展)； [译者注：此处 “元数学” 译自 “meta-mathematics”，不过这里所举的有些内容，如历史、实践等，通常并不属于元数学的范畴。]

严密的数学 (所有细节都正确、细致而完整地给出)；

美丽的数学 (比如 Ramanujan 的令人惊奇的恒等式；陈述简单漂亮，证明却很困难的结果)；

优美的数学 (比如 Paul Erdős 的 “来自天书的证明” 观念；通过最少的努力得到困难的结果)； [译者注： “来自天书的证明” 译自“proofs from the Book”。 Paul Erdős 喜欢将最优美的数学证明说成是来自 “The Book” (我将之译为 “天书”)，他有这样一句名言：你不一定要相信上帝，但应该相信 “The Book”。 Erdős 去世后的第三年，即 1998 年， Martin Aigner 和 Günter M. Ziegler 以《来自天书的证明》为书名出版了一本书，收录了几十个优美的数学证明，以纪念 Erdős。]

创造性的数学 (比如本质上新颖的原创技巧、观点或各类结果)；

有用的数学 (比如会在某个领域的未来工作中被反复用到的引理或方法)；

强有力的数学 (比如与一个已知反例相匹配的敏锐的结果，或从一个看起来很弱的假设推出一个强得出乎意料的结论)；

深刻的数学 (比如一个明显非平凡的结果，比如理解一个无法用更初等的方法接近的微妙现象)；

直观的数学 (比如一个自然的、容易形象化的论证)；

明确的数学 (比如对某一类型的所有客体的分类；对一个数学课题的结论)。

如上所述，数学品质这一概念是一个高维的 (high-dimensional) 概念，并且不存在显而易见的标准排序[注二]。我相信这是由于数学本身就是复杂和高维的，并且会以一种自我调整及难以预料的方式而演化；上述每种品质都代表了我们作为一个群体增进对数学的理解及运用的不同方式。至于上述品质的相对重要性或权重，看来并无普遍的共识。这部分地是由于技术上的考虑：一个特定时期的某个数学领域的发展也许更易于接纳一种特殊的方法；部分地也是由于文化上的考虑：任何一个特定的数学领域或学派都倾向于吸引具有相似思维、喜爱相似方法的数学家。它同时也反映了数学能力的多样性：不同的数学家往往擅长不同的风格，因而适应不同类型的数学挑战。

我相信 “好数学” 的这种多样性和差异性对于整个数学来说是非常健康的，因为它允许我们在追求更多的数学进展及更好的理解数学这一共同目标上采取许多不同的方法，并开发许多不同的数学天赋。虽然上述每种品质都被普遍接受为是数学所需要的品质，但牺牲其它所有品质为代价来单独追求其中一两种却有可能变成对一个领域的危害。考虑下列假想的 (有点夸张的) 情形：

一个领域变得越来越华丽怪异，在其中各种单独的结果为推广而推广，为精致而精致，而整个领域却在毫无明确目标和前进感地随意漂流。

一个领域变得被令人惊骇的猜想所充斥，却毫无希望在其中任何一个猜想上取得严格进展。

一个领域变得主要通过特殊方法来解决一群互不关联的问题，却没有统一的主题、联系或目的。

一个领域变得过于枯燥和理论化，不断用技术上越来越形式化的框架来重铸和统一以前的结果，后果却是不产生任何令人激动的新突破。

一个领域崇尚经典结果，不断给出这些结果的更短、更简单及更优美的证明，但却不产生任何经典著作以外的真正原创的新结果。

在上述每种情形下，有关领域会在短期内出现大量的工作和进展，但从长远看却有边缘化和无法吸引更年轻的数学家的危险。幸运的是，当一个领域不断接受挑战，并因其与其它数学领域 (或相关学科) 的关联而获得新生，或受到并尊重多种 “好数学” 的文化熏陶时，它不太可能会以这种方式而衰落。这些自我纠错机制有助于使数学保持平衡、统一、多产和活跃。

现在让我们转而考虑前面提出的另一个问题，即我们到底该不该试图对 “好数学” 下定义。

下定义有让我们变得傲慢自大的危险，特别是，我们有可能因为一个真正数学进展的奇异个例不满足主流定义[注三]而忽视它。另一方面，相反的观点 - 即在任何数学研究领域中所有方法都同样适用并该得到同样资源[注四]，或所有数学贡献都同样重要 - 也是有风险的。那样的观点就其理想主义而言也许是令人钦佩的，但它侵蚀了数学的方向感和目的感，并且还可能导致数学资源的不合理分配[注五]。真实的情形处于两者之间，对于每个数学领域，现存的结果、传统、直觉和经验 (或它们的缺失) 预示着哪种方法可能会富有成效，从而应当得到大多数的资源；那种方法更具试探性，从而或许只要少数有独立头脑的数学家去进行探究以避免遗漏。比方说，在已经发展成熟的领域，比较合理的做法也许是追求系统方案，以严格的方式发展普遍理论，稳妥地延用卓有成效的方法及业已确立的直觉；而在较新的、不太稳定的领域，更应该强调的也许是提出和解决猜想，尝试不同的方法，以及在一定程度上依赖不严格的启示和类比。因此，从策略上讲比较合理的做法是，在每个领域内就数学进展中什么品质最应该受到鼓励做一个起码是部分的 (但与时俱进的) 调查，以便在该领域的每个发展阶段都能最有效地发展和推进该领域。比方说，某个领域也许急需解决一些紧迫的问题；另一个领域也许在翘首以待一个可以理顺大量已有成果的理论框架，或一个宏大的方案或一系列猜想来激发新的结果；其它领域则也许会从对关键定理的新的、更简单及更概念化的证明中获益匪浅；而更多的领域也许需要更大的公开性，以及关于其课题的透彻介绍，以吸引更多的兴趣和参与。因此，对什么是好数学的确定会并且也应当高度依赖一个领域自身的状况。这种确定还应当不断地更新与争论，无论是在领域内还是从通过旁观者。如前所述，有关一个领域应当如何发展的调查，若不及时检验和更正，很有可能会导致该领域内的不平衡。

上面的讨论似乎表明评价数学品质虽然重要，却是一件复杂得毫无希望的事情，特别是由于许多好的数学成就在上述某些品质上或许得分很高，在其它品质上却不然；同时，这些品质中有许多是主观而难以精确度量的 (除非是事后诸葛)。然而，一个令人瞩目的现象是[注六]：上述一种意义上的好数学往往倾向于引致许多其它意义上的好数学，由此产生了一个试探性的猜测，即有关高品质数学的普遍观念也许毕竟还是存在的，上述所有特定衡量标准都代表了发现新数学的不同途径，或一个数学故事发展过程中的不同阶段或方面。

个例研究： Szemerédi 定理

现在我们从一般转向特殊，通过考察 Szemerédi 定理 - 那个声称任何具有正 (上) 密度的整数子集必定包含任意长度算术序列的漂亮而著名的结果 - 的内容及历史来说明上段所述的现象。这里我将避免所有的技术细节。 [译者注： 1. 整数子集 A 的 “上” 密度，指的是 lim supN→∞ |A∩[-N,N]|/2N，其中序列 aN 的上极限 lim supN→∞ aN 定义为 AN=supk≥N ak 的极限。 2. 算术序列 (在后文中有时被简称为序列) 指的是由整数组成的等差序列，序列中的整数个数称为算术序列的长度。]

这个故事有许多个自然的切入点。我将从 Ramsey 定理 - 任何有限着色的足够大的完全图必定包含大的单色完全子图 (比如任意六人中必有三人要么彼此相识，要么彼此陌生，假定 “相识” 是一个有良好定义的对称关系) - 开始。这个很容易证明 (无需用到比迭代鸽笼原理更多的东西) 的结果代表了一种新现象的发现，并且开辟了一系列新的数学结果： Ramsey 型定理。这些定理中的每一个都是数学上一个新近洞察的观点 “完全无序是不可能的” 的不同表述。 [译者注： 1. 完全图指的是任意两个顶点间都有边相连的图。 2. 鸽笼原理也叫 Dirichlet 抽屉原理，它最简单的版本指的是将 n>k 件东西放入 k 个容器中，其中至少有一个容器含有多于一件东西。]

最早的 Ramsey 型定理之一 (事实上比 Ramsey 定理还早了几年) 是 van der Waerden 定理：给定整数集的一个有限着色，其中必有一个单色类包含任意长度算术序列。 van der Waerden 的高度递归的证明非常优美，但有一个缺点，那就是它给出的出现第一个给定长度算术序列的定量下界弱得出奇。事实上，这个下界含有序列长度和着色种数的 Ackermann 函数。 Erdös 和 Turán 所具有的良好数学品位，以及希望在 (当时还是猜想的) 素数是否包含任意长度算术序列这一问题上获取进展的企图，使他们对这一定量问题做了进一步的探究[注七]。他们推进了一些很强的猜想，其中一个成为了 Szemerédi 定理；另一个则是一个漂亮 (但尚未证明) 的更强的命题，它声称任何一个倒数和非绝对可和的正整数集都包含任意长度算术序列。 [译者注： 1. 译文 “定量下界” 所对应的原文是比较笼统的 “quantitative bounds” (即未指明是上界还是下界)。 2. Ackermann 函数 A(m,n) (其中 m、 n 为非负整数) 的递归定义是： A(0,n)=n+1； A(m,0)=A(m-1,1)； A(m,n)=A(m-1,A(m,n-1))，它的增长速度快于任何初等递归函数 (包括指数函数)。 3. Tao 对 Erdös 和 Turán 所提出的 “更强的命题” 的表述略显冗余，其中 “非绝对可和” 可简化为 “非可和” 或 “发散” (因为他所讨论的是正整数集)。]

在这些猜想上的第一个进展是一系列反例，最终汇集为 Behrend 对不存在长度 3 算术序列的适度稀疏集 (对于任意给定的 ε，这个集合在 {1, ..., N} 中的密度渐近地大于 N-ε) 的优美构造。这一构造排除了 Erdös-Turán 猜想中最具野心的部分 (它猜测多项稀疏集包含大量的序列)，而且还排除了很大一类解决这些问题的方法 (比如那些基于 Cauchy-Schwarz 或 Hölder 之类不等式的方法)。这些例子虽不能完全解决问题，但它们表明 Erdös-Turán 猜想若成立，将需要一个非平凡的 (从而想必是有趣的) 证明。

下一个主要进展来自于 Roth，他以一种优美的方式运用 Hardy-Littlewood 的圆法[注八]及一种新的方法 (密度增量论证)，确立了 Roth 定理：每一个密度为正的整数集都包含无穷多个长度 3 序列。接下去很自然的就是试图将 Roth 的方法推广到更长的序列。 Roth 和许多其他人在这方面花费了好几年的时间，却没能取得完全的成功。困难的起因直到很久之后才由于 Gowers 的工作而得到显现。问题的解决则依靠了 Endré Szemerédi 的惊人才华，他重新回到了纯粹的组合方法上 (特别是，把密度增量论证推进到了一个令人瞩目的技术复杂度上)，将 Roth 的结果首先推广到长度 4[注九]，然后到任意长度，从而确立了他的著名定理。 Szemerédi 的证明是一项技术绝活，它引进了许多新想法和新技巧，其中最重要的一个是引进了看待极端复杂图的新方法，即通过有界复杂模型来取近似。这一结果，即著名的 Szemerédi 正规性引理 (Szemerédi regularity lemma)，在很多方面都引人注目。如上所述，它给出了有关复杂图结构的全新洞察 (在现代术语中，这被视为那些图的结构定理和紧致定理)；它提供了一种将在本故事后面部分变得至关重要的新的证明方法 [能量增量方法 (energy increment method)]；它还导致了从图论到性质检验到加性组合学的数量多得难以置信的意外应用。可惜的是，正规性引理的完整故事太过冗长，无法在这里加以叙述。 [译者注： 1. 密度增量论证 (density increment argument) 的含义在下篇中将有所提及。 2. 性质检验 (property testing) 是图论及组合学中一类相当困难的判定问题。 3. 加性组合学 (additive combinatorics) 是一个旨在研究集合中加性结构的数学分支。]

Szemerédi 的成就无疑是本故事的一个重点，但它绝不是故事的终结。 Szemerédi 对其定理的证明虽然初等，却极为复杂、不易理解。并且它也没能完全解决启发 Erdös 和 Turán 进行研究的原始问题，因为这一证明本身在两个关键地方用到了 van der Waerden 定理，从而无法改进该定理中的定量下界。接下来是 Furstenberg，他的数学品位使他试图寻找一种本质上不同的 (高度非初等的[注十]) 证明，他所依据的是组合数论与各态历经理论之间富有远见的类比，这一类比很快被他表述为很有用的 Furstenberg 对应原理。从这个原理[注十一]人们可以很容易地得出结论： Szemerédi 定理等价于保测体系中的多重回归定理，由此可以很自然地直接运用各态历经理论中的方法，特别是通过考察这种体系中各种可能的分类及结构分解 (比如各态历经分解)，来证明这一定理 (现在被称为 Furstenberg 回归定理)。事实上， Furstenberg 很快建立了 Furstenberg 结构定理，这一定理把所有保测体系都描述为一个平凡体系的一系列紧致拓展 (compact extension) 的弱混合拓展 (weakly mixing extension)。在这一定理及几个附加论证 (包括 van der Waerden 论证的一个变种) 的基础上可以确立多重回归定理，从而给出 Szemerédi 定理的一个新的证明。同样值得一提的是 Furstenberg 还撰写了有关这一领域及相关课题的优秀著作，在对这一领域的成长及发展做出重大贡献的同时对基础理论作了系统的形式化。

Furstenberg 与其合作者随后意识到这一新方法所具有的强劲潜力可以用来确立许多类型的回归定理，后者 (通过对应原理) 又可以产生一些高度非平凡的组合定理。顺着这一思路， Furstenberg、 Katznelson 及其他人获得了 Szemerédi 定理的许多变种和推广，比如高维空间的变种，他们甚至确立了 Hales-Jewett 定理的密度版本 (这是 van der Waerden 定理的一个非常有力及抽象的推广)。这些通过无穷各态历经理论技巧所获得的结果中的许多，人们至今也不知道是否存在 “初等” 证明，这证实了这种方法的力量。不仅如此，作为这些努力的一个有价值的副产品，人们还获得了对保测体系结构分类的深刻得多的理解。特别是，人们意识到对于许多类型的回归问题，一个任意体系的渐进回归性质几乎完全由该体系的一个特殊因子所控制，这个因子被称为该体系的 (最小) 特征因子[注十二]。确定各类回归中这一特征因子的精确性质于是便成为了研究的焦点，因为这将导致有关极限行为的更精确的信息 (特别是，它将显示与多重回归有关的某些渐进表达式实际上收敛于一个极限，这在 Furstenberg 的原始论证中是悬而未决的)。 Furstenberg 和 Weiss 的反例，及 Conze 和 Lesigne 的结果，逐渐导致一个结论，即这些特征因子应该由一个非常特殊的 (代数型的) 保测体系，即与幂零群 (nilpotent group) 相联系的零系统 (nilsystem)，来描述。这些结论的集大成者是对这些因子给予精确及严格描述的技术上引人注目的 Host 和 Kra 的论文 (及随后的 Ziegler 的论文)，它在得到其它一些结果的同时解决了刚才提到的渐进多重回归平均的收敛性问题。这些特征因子所扮演的核心角色相当充分地表明了存在于 (由零系统所表示的) 结构与 (由某些技术型的 “混合” 性质所刻划的) 随机性之间的二向性 (dichotomy)，以及一种深刻的见解，即 Szemerédi 定理的力量实际上是源于这一二向性。 Host-Kra 分析的另一个值得一提的特点是平均概念在 “立方体” 或 “超平行体” 中令人瞩目的出现，出于一些原因，它比与算术序列有关的多重回归平均更易于分析。 [译者注： 1. Hales-Jewett 定理的大致内容是：如果用 m 种颜色来给一个边长为 n 的多维点阵着色，那么只要点阵的维数足够高，就必定存在同色的长度为 n 的行、列、对角线等。 2. “dichotomy” 在数学与逻辑中通常译为二分法，不过在本文中似以译成 “二向性” 或 “二重性” 为佳，因为 “二分法” 这一译名过于强调两种性质之间的区分而非联系。]

与这些各态历经理论的进展相平行，其他数学家则在寻找用别的方式来理解、重新证明及改进 Szemerédi 定理。 Ruzsa 和 Szemerédi 取得了一个重要的概念突破，他们用上面提到的 Szemerédi 正规性引理确立了一些图论中的结果，包括现在被称为三角消除引理 (triangle removal lemma) 的引理，其大致内容是说一个包含少数三角形的图中的三角形可以通过删除数目少得令人惊讶的边而消除。他们随后发现前面提到的 Behrend 例子对这一引理的定量下界给出了某种极限，特别是它排除了许多类型的初等方法 (因为那些方法通常给出多项式型的下界)，事实上迄今所知消除引理的所有证明都是通过正规性引理的某些变种。将这一联系反过来应用，人们发现其实三角消除引理蕴含了 Roth 关于长度 3 序列的定理。这一发现首次开启了通过纯图论技巧证明 Szemerédi 型定理的可能性，从而抛弃了问题中几乎所有的加性结构 (注意各态历经方法仍然保留了这一结构，以作用在系统上的移位算符的面目而出现； Szemerédi 的原始证明也只是部分是图论的，因为它在许多不同环节用到了序列的加性结构)。不过，一段时间之后人们才意识到图论方法与先于它出现的 Fourier 分析方法在很大程度上局限于检测象三角形或长度 3 序列那样的 “低复杂度” 结构，检测更长的序列将需要复杂得多的超图理论。特别是，这启示了 (由 Frankl 和 Rödl 率先提出的) 一个计划，意在寻找超图理论中正规性引理的类比，这将足以产生象 Szemerédi 定理 (及其变种和推广) 那样的推论。这被证明是一项复杂得令人吃惊的工作，尤其是要仔细安排这种正规化中参数的等级[注十三]，使之以正确的顺序相互主导。事实上，能够从中推出 Szemerédi 定理的正规性引理及与之相伴的记数引理 (counting lemma) 的最终证明直到最近才出现。 Gowers 的很有教益的反例也是值得一提的，它表明原始的正规性引理中的定量下界必须至少是塔状指数形式 (tower-exponential)，从而再次显示这一引理非同寻常的性质 (和力量)。 [译者注： 1. 三角形消除引理中的 “少得令人惊讶” 是相对于三角形的数目而言的，它指的是用删除 O(n2) 条边来消除 O(n3) 个三角形。 2. 超图 (hypergraph) 是普通图的推广，在其中边可以连接两个以上的顶点 (类似于多元关系)。]

自 Roth 之后未曾有实质进展的 Fourier 分析方法最终由 Gowers 做了重新考察。和其它方法一样， Fourier 分析方法首先确立了整数集中的二向性，即他们在某种意义上要么是有结构的，要么是伪随机的。这里的结构这一概念是由 Roth 提出的：有结构的集合在中等长度算术序列上有一个密度增量，但有关伪随机或 “均匀性” 的正确概念却没那么清楚。 Gowers 提出了一个反例 (事实上这一反例与前面提到的 Host 与 Kra 的例子有着密切的关系)，表明以 Fourier 分析为基础的伪随机概念对于控制长度 4 或更长的序列是不够的，他随后引进了一个满足需要的不同的均匀性概念 (与 Host 和 Kra 的立方体平均有很密切的关系，与某些超图正规性的概念也有关系)。剩下的工作就是为二向性确立一个定量且严格的形式。这却是一项困难得出人意料的工作 (主要是由于这一方法中 Fourier 变换的效用有限)，并且在许多方面与 Host-Kra 及 Ziegler 试图将特征因子赋予零系统代数结构的努力相类似。但是，通过将 Fourier 分析工具与诸如 Freiman 定理和 Balog-Szemerédi 定理等加性组合学的主要结果，及一些新的组合与概率方法结合在一起， Gowers 用令人瞩目的高超技巧成功地完成了这一工作，他并且得到了有关 Szemerédi 定理和 van der Waerden 定理的非常强的定量下界[注十四]。 [译者注： Freiman 定理是一个有关具有小和集的整数集中算术序列性质的定理 (一个整数集 A 的和集 A+A 是由该整数集本身及其中任意两个数的和组成的集合，小和集则是指 |A+A| ).

总结起来，人们给出了 Szemerédi 定理的四种平行的证明；一种是通过直接的组合方法，一种是通过各态历经理论，一种是通过超图理论，还有一种是通过 Fourier 分析及加性组合学。即便有了这么多的证明，我们依然觉得有关自己对这一结果的理解还不完全。比方说，这些方法中没有一种强到能够检测素数中的序列，这主要是由于素数序列的稀疏性 (不过， Fourier 方法，或更确切地说 Hardy-Littlewood-Vinogradov 圆法，可以用来证明素数中存在无穷多长度 3 序列，并且在付出很大努力后可以部分地描述长度 4 序列)。但是通过调和分析中的限制理论 (这是另一个我们将不在这里讨论的引人入胜的故事)， Green 能够将素数 “当成” 稠密来处理，由此得到了一个有关素数稠密子集的类似于 Roth 定理的结果。这为相对 Szemerédi 定理 (relative Szemerédi theorem) 开启了可能性，使人们能检测整数集以外的其它集合，比如素数，的稠密子集中的算术序列。事实上，一个与相当稀疏的随机集合的稠密子集有关的相对 Roth 定理 (relative Roth theorem) 的原型已经出现在了图论文献中。

在与 Ben Green 的合作[注十五]中，我们开始试图将 Gowers 的 Fourier 分析及组合论证方法相对化到诸如稀疏随机集合或伪随机集合的稠密子集这样的情形中。经过许多努力 (部分地受到超图理论的启示，它已被很好地用来计算稀疏集合中的结构；也部分地受到 Green 正规性引理的启示，它将图论中的 “算术正规性引理” 转用到了加性理论中)，我们逐渐能够 (在一项尚未发表的工作中) 检测这类集合中的长度 4 序列。这时候，我们意识到了我们所用的正规性引理与 Host-kra 有关特征因子的构造之间的相似性。通过对这些构造的置换[注十六] (特别依赖于立方体平均)，我们可以确立一个令人满意的相对 Szemerédi 定理，它依赖于一个特定的转化原理 (transference principle)，粗略地说，该原理断言稀疏伪随机集合的稠密子集的行为 “就好比” 它们在初始集合中就是稠密的。为了将这一定理应用于素数，我们需要将素数包裹在一个适当的伪随机集合 (或者更确切地说，伪随机测度) 中。对我们来说很偶然的是， Goldston 和 Yildirim 最近有关素数隙的突破[注十七][注十八]几乎恰好构造了我们所需要的东西，使我们最终确立了早年的猜想，即素数集包含任意长度的算术序列。 [译者注： 1. 这里提到的 Tao 与 Green 合作所得的结果 “素数集包含任意长度的算术序列” 被称为 Green-Tao 定理。 2. 这里提到的 Goldston 和 Yildirim 的工作，及原文 [注十七] 提到的故事可参阅拙作孪生素数猜想及该文末尾的补注。]

故事到这里仍未结束，而是继续沿几个方向发展着。一方面转化原理现在已经有了一些进一步的应用，比如获得高斯素数中的组团 (constellation) 或有理素数中的多项序列。另一个很有前途的研究方向是 Fourier 分析、超图理论及各态历经方法的彼此汇聚，比如发展图论与超图理论的无穷版本 (它在其它数学领域，如性质检验，中也有应用)，或各态历经理论的有限版本。第三个方向是使控制各态历经情形下的回归的零系统也能控制算术序列的各种有限平均。特别是， Green 和我正在积极地计算素数及由零系统 (通过 Vinogradov 方法) 产生的序列之间的关联，以便确立能够在素数中找到的各种结构的精确渐进形式。最后，但并非最不重要的是最初的 Erdös-Turán 猜想，它在所有这些进展之后仍未得到解决，不过现在 Bourgain 已经取得了一些非常有希望的进展，这应该能引导出进一步的发展。 [译者注： 1. 高斯素数 (Gaussian prime) 是素数概念在高斯整数集 (即形如 m+ni 的复数组成的集合，其中 m、 n 均为整数) 中的推广。 2. 有理素数 (rational prime) 是普通素数在高斯整数集中的称谓。]

结论

如我们在上述个例研究中可以看到的，好数学的最佳例子不仅满足本文开头所列举的数学品质判据中的一项或多项，更重要的，它是一个更宏大的数学故事的一部分，那个故事的展开将产生许多不同类型的进一步的好数学。

实际上，人们可以将整个数学领域的历史看成是主要由少数几个这类好故事随时间的演化及相互影响所产生的。因此我的结论是，好数学不仅仅是用前面列举的一个或几个 “局部” 品质来衡量的 (尽管那些品质无疑是重要且值得追求与争论的)，还要依赖于它如何通过继承以前的成果或鼓励后续发展来与其它好数学相匹配这样更 “全局” 的问题。当然，如果不凭借后见之利，要确切地预言什么样的数学会具有这种品质是困难的。不过实际上似乎存在某种无法定义的感觉，使我们能感觉到某项数学成果 “触及了什么东西”，是一个有待进一步探索的更大谜团的一部分。在我看来，追求这种对发展潜力的难以言状的保障，对数学进展来说起码是与前面列举的更具体更显然的数学品质同等重要的。因此我相信，好数学并不是单纯的解题、构筑理论、对论证进行简化、强化、明晰化、使论证更优美、更严格，尽管这些无疑都是很好的目标。在完成所有这些任务 (及争论一个给定领域中哪一个应该有较高的优先权) 的同时，我们应该关注我们的结果所可能从属的任何更大的范围，因为那很可能会对我们的结果、相应的领域，乃至整个数学产生最大的长期利益。

注释

[注一] 上述列举无意以完备自居。尤其是，它主要着眼于研究性数学文献中的数学，而非课堂、教材或自然科学等接近数学的学科中的数学。
[注二] 特别值得指出的是数学严格性虽然非常重要，却只是界定高品质数学的因素之一。
[注三] 一个相关的困难是，除了数学严格性这一引人注目的例外，上述品质大都有点主观，因而含有某种不精确性与不确定性。我们感谢 Gil Kalai 强调了这一点。
[注四] 稀缺资源的例子包括钱、时间、注意力、才能及顶尖刊物的版面。
[注五] 这一问题的另一个解决方法是利用数学资源也是多维这一事实。比如人们可以为展示、创造性等等设立奖项，或为不同类型的成果设立不同的杂志。我感谢 Gil Kalai 对这一点的洞察。
[注六] 这一现象与 Wigner 所发现的 “数学的不合理有效性” (unreasonable effectiveness of mathematics) 有一定的关联。 [译者注： Wigner 的这一说法见于他 1960 年发表的文章 "The Unreasonable Effectiveness of Mathematics in the Natural Sciences"。]
[注七] Erdös 也研究了 Ramsey 原始定理中的定量下界，由此导致的结果中包括了对在组合学中极其重要的概率方法的确立，不过这本身就是一个很长的故事，我们没有足够的篇幅在这里讨论。
[注八] 同样，圆法的历史也是一段我们无法细述的精彩故事。不过只要提这样一点就足够了，那便是用现代语言来说，这一方法是 “Fourier 分析是解决加性组合学问题的重要工具” 这一现代标准见解的一部分。
[注九] 在这之后， Roth 很快就将 Szemerédi 的想法与他自己的 Fourier 分析方法组合在一起，给出了针对长度 4 序列的 Szemerédi 定理的混合证明。
[注十] 比方说，某些版本的 Furstenberg 论证严重依赖于选择公理，尽管将之修改为不依赖选择公理也是可能的。
[注十一] 对拓扑动力系统也存在类似的对应原理将 van der Waerden 定理与多重回归定理等价起来。这引出了有关拓扑动力学的迷人故事。
[注十二] 这方面的早期例子是 von Neumann 的平均各态历经定理，在其中移位不变函数 (shift-invariant function) 的因子控制了移位简单平均的极限行为。
[注十三] 这一等级看来与 Furstenberg 在其使保测体系 “正规化” 的类似探索中所遇到的一系列拓展有关，尽管我们现在对其确切关联还了解得很少。
[注十四] 同样值得一提的是 Shelah 有关 van der Waerden 定理的杰出的创造性证明，它曾经保持着有关这一定理的最佳常数的纪录。
[注十五] 顺便说一下，我最初被这些问题所吸引是因为它们与另一个重大的数学故事，我们在此处没有篇幅讨论的 Kakeya 猜想，之间的联系。它们与前面提到的有关限制理论的故事之间的关系则是多少有点出人意料的。
[注十六] 出于几个原因，这里有一点技巧性。最明显的是各态历经构造本质上是无穷的，但为了处理素数却必须在有限的情况下使用。幸运的是，我曾经尝试过将各态历经方法有限化以便应用于 Szemerédi 定理。虽然那一尝试在当时并不完全，但后来发现它足以对我们研究素数提供帮助。
[注十七] 在我们写论文的时候，我们所采用的构造来自于 Goldston 和 Yıldırım 的一篇文章，那篇文章曾因为一个与我们工作无关的缺陷而被他们收回，后来他们通过一些聪明的新想法弥补了缺陷。这对我们前面提到的一个观点，即一项数学工作不一定要在所有细节上都绝对正确才能对未来的 (严密) 工作有所助益，是一种支持。
[注十八] 有关素数隙的故事也是一个我们无法在这里讲述的有趣的故事。

附录： Alain Connes 的评论 (2007-02-19)
... ... 很难评论 Tao 的这篇文章，第二部分有关 Szemeredi 定理的个例不错且很有趣，但第一部分有那种艺术家试图通过一系列标准来定义美的痛苦意味。这种类型的判断是如此主观，我很真切地感到除了显而易见的傲慢自大外没学到任何东西 ... ... [译者注： Connes 提到的这种 “傲慢自大” Tao 自己也提到了，并试图予以说明 (本译文上篇最后两段)，但看来说明是徒劳的。还是 Hardy 看得比较透彻，他说： “对一位职业数学家来说，发觉自己在 writing about mathematics 是一种郁闷的感觉”， Hardy 自己虽然也做了这件 “郁闷” 的事，但那时他已经 63 岁，比 Tao 大了一倍。]