为何说数学是最重要的学科?
【千问解读】
图源:pixabay
导读:
从顶级奖项获奖者的专业背景可以看出学科之间的关系。
我们收集了8个学科的主要奖项获奖者的专业背景,并尝试利用量化手段计算了学科之间的关系,以及获奖者专业与所获奖项之间的关系。
如果我们重新访问C.P.Snow 在1950年代提出的“两种文化”(即科学文化和文科文化)之分的说法,只能得出悲观的结论:学科之间的距离越拉越大,学科的融通几乎不可能。
但硬核的学科,例如数学,却可能为所有其他学科奠定基础。
奖项不一定能告诉全部真相,但能告诉一些真相。
尼克 | 撰文
科技奖项的获得者所学专业与他们所获奖项之间的关系是一个有趣的课题。
我们选择了8个不同学科的世界最高奖项,整理了共1598位获奖者的背景信息。
选取的学科包括6个理工学科:数学、物理、化学、生命科学、工程和计算机科学。
理工学科科技奖项的评判标准相对客观,更容易得到共识。
物理学、化学和生命科学的获奖者以诺贝尔奖为主,并辅以一两项本学科最高奖。
数学、计算机和工程则以本学科所颁发的影响力最大的奖项为主,尽量使每个学科的获奖者人数差别不是很大——每个奖项差不多200人左右。
工程被当作一个整体而没有被进一步细分成不同的子学科,这是参照微软学术图谱(MAG)的分类方法。
诺贝尔经济学纪念奖,虽然不属正统诺贝尔奖,但其被经济学共同体认可。
为了和这些理工类奖项和准理工类的经济学奖作为对比,我们也选择了一个纯文科专业:哲学,主要目的是考察文理两种文化的差别。
各奖项的数据一般自设立开始统计,直至2024年11月。
数据包括获奖者的本科学位和终极学位(一般是博士)的专业。
如果一位获奖者取得多个专业学位,则分别统计。
如果一位获奖者在同一个领域内获得多个奖项,则根据获奖时间,计最早所获奖项,不重复统计。
例如巴丁(John Bardeen)曾两次获诺贝尔物理奖(1956年和1972年),但只计1956年一次。
纳入统计的奖项见以下表格。
表1 奖项列表
SAIXIANSHENG
一、获奖者所获学位专业背景分析
数学领域获奖者
图1 数学奖项获奖者所学专业
数学领域获奖者,取得的博士专业中数学占比最高,偶有物理专业。
这基本体现了数学的专注性。
而获奖者的本科专业背景比博士专业稍显多样,除了数学之外,还包括了计算机科学、工程等。
一个值得注意的例外(outlier)是本科专业为历史、博士专业是物理的威腾(Edward Witten),他获1990年菲尔兹奖。
2010年菲尔兹奖得主吴宝珠(Ngô Bảo Châu),他本科是巴黎第11大学数学和计算机科学双学位,他的案例体现了数学和计算机科学的紧密关系。
此外,2021年阿贝尔奖得主是理论计算机科学家威格森(Avi Wigderson),他也是2023年图灵奖得主。
物理领域获奖者
图2 物理奖项获奖者专业
物理领域获奖者所受的专业训练背景明显比数学领域更加多元。
他们获取的博士学位,除物理和天文之外,数学也占了一定比例。
与物理学关系密切的工程和化学也榜上有名。
物理学的“局外人”(outlier)是本科学习心理学、博士学位为人工智能的2024新科诺奖得主辛顿(Geoffrey Hinton)。
化学领域获奖者
图3 化学奖项获奖者专业
化学获奖者所接受的教育背景要比物理获奖者更加多元。
他们拿到的学位,无论是本科学位还是博士学位,除化学外,多集中在物理、工程和生物。
这也体现了化学与物理、生物和工程诸学科之间关系密切。
工程领域获奖者
图4 工程奖项获奖者专业
工程奖得主的专业背景呈现最高的多样性。
一方面,工程学科包罗万象;另一方面,工程学科是跨学科的。
工程奖没有进一步细分为不同的工程子学科,例如化学工程、机械工程等——我们在此依循微软学术图谱(MAG)的分类。
计算机科学领域
图5 计算机奖项获奖者专业
计算机领域的获奖者专业背景非常多样化。
除计算机科学专业本身外,数学、工程和物理专业的占比很大。
这反映了计算机科学与这两个领域的紧密联系。
另外,计算机科学相对年轻,美国和英国最早的几个计算机系建立于1960年代中期。
大部分排名靠前的计算机系都建立于1970年代。
早期计算机科学系的教员多具数学和电气工程背景。
理论计算机科学是数学和计算机科学的交叉。
美国很多学校的计算机工程专业至今还处于电气工程系之内,有些学校除了计算机科学系之外,单设电气与计算机工程系(ECE,Department of Electrical and Computer Engineering),相对于计算机科学,ECE中的计算机工程更偏向硬件和工程实现。
值得注意的是,政治学专业在计算机科学获奖人中占了一席之地,这个突出的例外是图灵奖得主司马贺(Herbert Simon)。
另一个例外是计算机先驱奖(IEEE Computer Pioneer Award)得主Betty Holberton,她是最早的计算机之一ENIAC的6个程序员之一,她本想学数学,但最后在宾夕法尼亚大学读了新闻,这是当时对女性开放的为数不多的专业之一。
计算机科学得奖人中相当一部分人就读本科时,计算机科学作为独立学科还不存在。
我们预期随着计算机科学变得成熟起来,得奖人专业出身的比例会有较大变化。
生命科学领域获奖者
图6 生命科学奖项获奖者专业
生命科学领域奖项只涉及诺贝尔生理医学奖和邵逸夫生命科学与医学奖。
获奖人的专业,无论是本科还是博士,在生物学之外,化学、医学和物理占主导。
经济领域获奖者
图7 经济奖项获奖者专业
经济学获奖者的专业背景,无论本科还是博士,经济学和数学都占比最大。
其次,本科专业中物理和工程占比不小,博士专业中统计学占比很高。
这反映了经济学对理工学科的高度依赖。
经济学的很多子学科,也和数学和工程等有交叉和重叠。
管理学在美国的绝大多数学校里没有本科学位,这里的例外是2009年诺贝尔经济奖得主Oliver E. Williamson,他本科是麻省理工学院斯隆管理学院毕业的。
哲学领域获奖者
图8 哲学奖项获奖者专业
哲学获奖者中,他们的专业背景,除了哲学专业外,理工科(如数学、物理、化学)的占比很大,经济学也为数不少。
哲学获奖者中本科来自哲学专业的比例,相较与其他学科是最低的;而其他奖项中却鲜见哲学专业。
换句话说,所有专业的受训者都可能获得哲学奖,而哲学专业的毕业生很难获得其他奖项。
作为总结,下图列出把得奖者本科专业作为输入(左边),所得奖项作为输出,我们可以轻易看出从人数上看,哪些学科与哪些奖项的关联。
图9 不同学科本科在各奖项的数量分布
图中左边列出了获奖者本科阶段获得的学位的专业,右边列出了不同领域的奖项。
在各个奖项中,拥有对应本学科背景的获奖者通常占比最高。
很明显,数学专业输出了最多的获奖者,几乎在每个奖项的获奖者中,都有数学专业的人,尤其是物理、工程、计算机科学和经济学领域的奖项。
这似乎佐证了这样的共识:数学是所有学科的基础。
紧随其后的是物理、化学和工程专业的获奖者。
SAIXIANSHENG
二、学科间的关联:
知识距离与知识簇
利用学术数据库中的所有学术文献之间的引用关系,计算出谷歌语义距离,可以进一步得到学科间的知识距离(见Zhang-2023)。
知识距离可以揭示学科之间的关联程度。
我们把知识距离的概念,应用于多种学术数据库,以测量不同学科之间的语义距离。
图10 数学与各学科的知识距离
MAG (Microsoft Academic Graph,微软学术图谱)是微软开放的学术图谱(见Sinha-2015和Wang-2019)。
2021年,微软停止对MAG的维护,MAG随后转型成OpenAlex。
截至2024年10月,OpenAlex收录了大约2.6亿篇学术文献,包括论文和书籍等。
所有文献通过65,000个概念(Concepts)索引,概念之间形成一个层级化的知识图谱。
其中,有19个顶层概念,例如数学、物理、化学、工程、经济学、政治学等。
顶层概念进一步细分为多个子领域和主题,以数学为例,它下面包含代数,而代数下面又包含抽象代数等。
在OpenAlex中,一个概念(或者一个研究领域)是属于该领域的论文集合。
我们计算了OpenAlex中数学、物理、工程、化学、计算机科学、生物、医学、经济、哲学、社会学和政治学等学科之间的语义知识距离。
数学与其他学科的距离见图10。
如果我们以学科与数学的距离衡量学科的“软硬程度”,计算机科学、物理、工程、甚至经济学之“硬”并不令人惊奇,倒是化学与生物之“软”让我们思考。
也许大部分化学和生物学尚未完全脱离经验的范畴,而计算机科学的子学科计算理论也是数学的子学科,物理学的子学科理论物理是许多数学家和物理学家的交叉课题。
所有学科之间的知识距离可以表示成图(见图11),图中,每个节点代表学科,节点大小表示学科中的文章数量。
节点之间的边表示学科之间的联系。
边的宽度表示两个学科之间的联系程度,边越宽,联系的紧密程度越高。
在这些学科中,数学与计算机科学、物理和工程的联系紧密。
数学与计算机科学之间的联系,甚至比数学和物理学的联系还要紧密。
数学、计算机科学、物理学和工程构成一个学科簇(cluster);而化学、生物和医学构成另一个学科簇。
所有人文和社会科学学科构成一个簇。
这颇似英国通才CP Snow的“两种文化”(见Snow-2011)之分,或美国物理学家惠勒(J.A. Wheeler)的“重型知识分子”(heavy intellectual,指基础性自然科学)和“轻型知识分子”(light intellectual)之分(见Wheeler-1996)。
Kagan也有所谓“三种文化”之说(见Kagan-2009),但他指的是“自然科学”、“社会科学”和“人文科学”,和我们通过数据计算得来的三簇划分法有所不同。
我们的研究表明,学科之间的知识距离会随着时间会变得越来越远。
威尔逊(E.O. Wilson)渴盼的知识融通(consilience,见Wilson-1999)几乎无望(见Zhang-2023)。
图11 学科间知识距离
SAIXIANSHENG
三、学科与奖项间的关系
图12 学科影响力
谷歌的PageRank算法可以计算一个图中节点的重要性。
学科获奖人的专业和所获奖项之间的关系可以用图来表示,利用PageRank算法可以计算学科专业的“重要性”,收敛后的结果如图所示。
图中,节点代表学科,节点越大,所代表的专业就越“重要”。
“重要性”可以被理解为学科的影响力。
节点间的连线表示获奖人的专业对获取其他学科领域奖项的影响,即学科之间的关系,边的宽度表示影响力的强度,箭头指向的学科是影响力的施加者。
数学的节点最大,这表明其在所有学科中扮演最基础和最核心的作用。
物理学和工程的节点也相对较大,与数学紧密相连。
生物学与化学和医学的联系较强。
这与我们关于知识距离和知识簇的研究互为佐证。
计算机科学与数学和工程学的关系密切。
经济学与数学和政治学有显著联系。
哲学虽然与多个学科有较弱的联系,但几乎没有什么影响力。
PageRank的排名与统计结果以及知识距离的研究一致。
SAIXIANSHENG
四、从知识复杂度看奖项
经济复杂度(Economic Complexity Index,ECI,见Hausmann-2013, Hidalgo-2021)是经合组织(OECD)用来衡量区域经济发展的指数,主要涉及两个概念:多样性(diversity)和泛在性(ubiquity),前者用来衡量一个区域生产不同产品的能力,后者衡量一个特定产品能被多少个不同区域所生产。
两者经过迭代,可以收敛到经济复杂度指标。
如果一个区域的多样性高且稀缺性大(泛在性低),那么这个区域的经济复杂度就高。
借助经济复杂度中的多样性和稀缺性概念,我们可以定义知识复杂度。
将获奖者在本科就读的学科专业类比为区域,将奖项类比为产品。
如果一门学科能“生产”较多的奖项,表明该学科具有较强的多样性,且奖项的稀缺性较大,说明这门学科的知识复杂度较高。
与PageRank的单向迭代不同,知识复杂度是通过多样性和稀缺性双向迭代而计算的。
下图列出8个学科的知识复杂度:
图13 学科知识复杂度
图中X-轴代表奖项的稀缺性,Y-轴代表学科的多样性,点的大小表示对应学科的得奖人数。
图12的右上方,表示学科的多样性和稀缺性都较高。
数学的多样性和稀缺性是最高的,这表明数学的知识复杂度最高。
哲学知识复杂度则最低。
这表明,数学专业的人可以获得最多的奖项,而获得数学奖项的其他专业则占比最小;反过来,获得哲学奖项的专业五花八门,而哲学专业获得其他专业奖项的可能性极低。
这可以被浅显地解释为:数学专业的毕业生可以得到最多的奖项种类,而能得到数学奖项的专业数目则最少。
知识复杂度和PageRank的结论互为佐证,例如,这两个测度都表明数学是最重的(heaviest)(按照物理学家惠勒的说法)或最硬的。
越复杂的知识越难被扩散,这个事实可以被经济复杂度间接地解释(见Hidalgo-2021),而可以用知识复杂度直接地解释。
SAIXIANSHENG
五、结论
我们收集了8个学科的主要奖项获奖者的专业背景,并利用知识距离和知识复杂度等量化手段计算了学科之间的关系,以及获奖者专业与所获奖项之间的关系。
奖项不一定能告诉全部真相,但能告诉一些真相。
作者简介:
尼克,乌镇智库理事长。
曾获吴文俊人工智能科技进步奖。
中文著作包括《人工智能简史》《理解图灵》《UNIX内核剖析》和《哲学评书》等。
参考文献:
1.Hausmann, Ricardo. et al, The Atlas of Economic Complexity: Mapping Paths to Prosperity (2013).
2.Hidalgo, C., Economic complexity theory and applications, Nature Reviews Physics, 3, pages92–113 (2021).
3.Kagan, J. The Three Cultures: Natural Sciences, Social Sciences and Humanities in the 21st Centuries, (2009).
4. Sinha, A., Shen, Z., Song, Y., Ma, H., Eide, D., Hsu, B., & Wang, K. An Overview of Microsoft Academic Service (MAS) and Applications. Proceedings of the 24th International Conference on World Wide Web (WWW ’15 Companion). ACM, New York, NY, USA. DOI=http://dx.doi.org/10.1145/2740908.2742839 (2015).
5.Snow, C.P. The Two Cultures, The REDE Lecture 1959, reissued edition (Cambridge University Press, 2011).
6. Wang, K., et al, A Review of Microsoft Academic Services for Science of Science Studies, Frontiers in Big Data, vol.2 December (2019).
7.Wheeler, John A., The Place of Science in Modern Life, At Home in the Universe, (1996).
8. Wilson, Edward O. Consilience: The Unity of Knowledge, (1999).
9.Zhang, Nick, Knowledge Consilience: One Culture, Two Cultures or Many Cultures? Arxiv arxiv.org/pdf/2308.03774 (2023).
声明:本文内容仅代表作者个人观点,与本站立场无关。
如有内容侵犯您的合法权益,请及时与我们联系,我们将第一时间安排处理