AI正在大爆发,但总体而言,按单位成本投入和人均成果来看,科学发现的效率正在下降:诺奖获得者的年龄提高了10岁、一个重要发现需要数十人的努力。究竟是哪里出了问题?
“科学发现才是唯一的新闻”。
这是作家斯图尔特·布兰德(Stewart Brand)的一句名言。
虽然新闻内容由政治、经济和娱乐八卦主导,但科学和技术才是人类福祉和文明长期进步的基础。现在,无论是科学家的数量、科学资助的规模,还是发表的科学论文数量,都比以前有大幅提升,因此也推动着人类各项事业的繁荣。
从表面上看,这无疑是令人鼓舞的。但是,在这些指标迅速增长的同时,我们对科学的理解是否取得了与之相应的进步?还是我们仅仅为了维持(甚至降低)科学进步的速度本身,投入了更多的资源?
《大西洋月刊》The Atlantic最近发布了一篇题为“Science Is Getting Less Bang for Its Buck”的文章,认为虽然像AI或者基因编辑这样的科技正在大爆发,但总体而言,科学发现的效率正在降低。
文章主要有几个有趣的观点:
自1990年以来的成果很少获诺奖,自1990年以来的成果仅获得三次诺贝尔奖。
在诺贝尔奖的早期,科学家获奖的平均只有37岁,而现在则到了平均47岁。
原子核被发现的时候,论文作者只有一位;希格斯粒子在2012年被发现的时候,相关的两篇论文各自拥有大约1000名作者。
AI和基因编辑技术大爆发,但按单位成本或人均指标来看,科学研究的效率正在下降。
为什么科学发现会变得如此昂贵和“低效”?
诺贝尔奖有偏见?强烈偏向早期研究成果,1990年代获奖较少
《大西洋月刊》进行了一项调查,要求科学家们比较其所在领域的诺贝尔奖获奖成果,然后使用这些排名信息,来确定科学家们对诺贝尔奖获奖成果的质量在过去几十年中的变化情况。
对于物理学奖,《大西洋月刊》调查了来自世界顶级学术物理系的93位物理学家(根据上海世界大学排名),请他们判断了1370对发现。
下图中的条形图显示了每十年的诺奖发现的评分。得分越高,说明评分者认为这个时段的发现比其他时段的发现更重要的可能性越大。请注意,统计是按发现的年份,而不是获奖年份。
20世纪的头十年的表现不尽如人意。这十年中,诺贝尔奖委员会仍在探索这个奖项奖励的是什么。比如现在有一个奖项,颁发给了能够更好地照亮海面的灯塔和浮标。如果你在船上航行,这无疑是个好消息,但它与现代物理学的关系不大。在20世纪最初十年,诺贝尔物理奖大多获奖成果符合现代物理的概念。
从1910年,到20世纪30年代是物理学发展的黄金时代。这是量子力学的时代,量子力学是有史以来最伟大的科学发现之一,从根本上改变了我们对现实的理解。量子力学还引发了了其他几项革命:X射线晶体学的发明,让我们得以探索原子世界。中子和反物质被发现。关于放射性和核力量的许多基本事实被发现。这是科学史上的最伟大的时期之一。
在此之后,评分出现了大幅下降,直到20世纪60年代出现部分回升。这主要是由于两个发现:宇宙 - 微波 - 背景辐射,以及粒子物理学的标准模型的建立,让我们发现了构成宇宙的基本粒子和力的最佳理论。即使凭借这些发现,从20世纪40年代到80年代,物理学家对这期间的诺奖成果的评价都要比从1910年代到1930年代中最低的十年评分更低。
图表数据截止到在20世纪80年代末。原因在于,近年来,诺贝尔奖委员会更愿意为产生于上世纪70-80年代的成果颁奖。事实上,自1990年以来的成果仅获得三次诺贝尔奖。这个数量太少了,无法对20世纪90年代的发现进行高质量的估计,因此我们没有对这些成果进行调查。
然而,自1990年以来的成果很少获奖这个事实本身就具有启发性。诺贝尔奖委员会倾向于跳过这几十年,为诞生时间更早的成果颁奖。鉴于20世纪70-80年代本身看起来就并不那么好,这对物理学来说是个坏消息。
物理学表现不佳,或许其他领域的情况好一些?《大西洋月刊》对诺贝尔化学奖和诺贝尔生理学或医学奖进行了类似的调查。以下是评分:
可以看到,结果比物理学奖稍好,在20世纪下半叶的评分比物理学奖可能略有改善。但与物理学奖一样,20世纪90年代和2000年以后的成果被省略了,因为诺贝尔奖委员会强烈偏向早期的研究成果:在20世纪90年代和2000年代完成的成果的奖励少于之前任何一个年代。
这项调查描绘出了一幅黯淡的场景:在过去的一个世纪里,我们大大增加了投入科学研究的时间和金钱,但在科学家自己的判断中,我们取得最重要的新突破的速度基本保持不变。按单位成本或人均指标来看,科学研究的效率正在下降。
当然,有人可能会说,诺贝尔奖成果的质量与科学进步的总体速度不是一回事!
这项调查当然有很多局限之处:诺贝尔奖没有包含一部分科学门类,特别是计算机科学等新兴领域;诺贝尔奖委员会偶尔也会错过重要的成果;也许一些偏见意味着科学家们更有可能尊重年头更长的成果;也许更重要的是更大量的科学成果,即构成大部分的普通科学发现。
这些局限确实存在,但是,我们很快就会看到有证据表明,全面的、重要的科学发现变得越来越困难。这需要更大规模的团队协作和更广泛的科学训练。
总之,这些结果表明,我们在科学上付出的努力,其回报率正在大幅下降。
科学家获奖年龄增加近10岁,过于关注已确立的领域导致科学进展困难
除了领域的维度,还有其他维度。
经济学家本杰明•琼斯(Benjamin Jones)和布鲁斯•温伯格(Bruce Weinberg)研究了科学家们在做出重大发现时的年龄。
他们发现,在诺贝尔奖的早期,科学家在获得诺贝尔奖的时候平均只有37岁。但最近这一数字上升到平均47年,相当于科学家职业生涯的四分之一。
也许今天的科学家需要懂得更多的知识才能做出重大发现。因此,他们需要学习更长的时间,所以在较为年长的年龄才能完成他们最重要的工作。也就是说,伟大的发现越来越难以实现,这就意味着它们的数量会减少,或者需要更多的努力。
同样的道理,现在的科学合作所涉及的人数比一个世纪前要多得多。当欧内斯特·卢瑟福在1911年发现原子核的时候,他所发表的论文中,作者只有一位,那就是他自己。相比之下,希格斯粒子在2012年宣布被发现的时候,相关的两篇论文各自拥有大约1000名作者。
平均而言,在20世纪,研究团队的规模几乎翻了两番,而且这种增长一直持续到今天。对于许多研究问题,它需要更多的技能、昂贵的设备和一支庞大的团队才能在今天取得进展。
如果科学变得越来越难是真的,为什么会这样呢?
假设我们认为科学,类似于对新大陆的探索。在早期,人们对此知之甚少,探索者很容易地开始并发现主要的新特性,但他们逐渐填补了新大陆的知识。
要想有重大发现,探险者必须在更加困难的条件下去更加偏远的地区,探索变得困难。按照这种观点,科学是一个有限的前沿领域,需要付出更多的努力才能“填满地图”。总有一天地图将接近完整,科学将在很大程度上被耗尽。从这个观点来看,任何发现困难的增加都是科学知识结构本身固有的。
但是有一种不同的观点,一种认为科学是无止境的,在这种观点中总是有新的现象要发现,有重大的新问题要回答。无限边界的可能性是一种被称为“出现(emergence)”想法的结果。
以水为例。用方程来描述单个水分子的行为是一回事。要理解为什么天空中会形成彩虹,或者海浪的撞击,或者彗星的起源,则完全是另一回事。所有这些都是“水”,但处于不同的复杂程度。
行为的“出现”程度这一事实并不一定意味着会有无穷无尽的新现象有待发现、新的问题有待解答。但在某些领域,这似乎是可能的。
例如,计算机科学始于1936年,当时图灵发明了数学模型,我们现在称之为图灵机。那个模型非常简陋,几乎像一个孩子的玩具。然而,这个模型在数学上等同于今天的计算机:计算机科学实际上是从它的“万物理论”开始的。尽管如此,自那以后,它还是看到了许多非凡的发现:诸如构成互联网商业和加密货币基础的加密协议等想法;编程语言设计中无穷无尽的美妙想法;更奇怪的是,最好的电子游戏中也有一些富有想象力的想法。
这些是计算机科学中的彩虹、海浪和彗星。更重要的是,到目前为止,我们的计算经验表明,它确实是取之不尽用之不竭的,总是有可能发现美丽的新现象,新层次的行为,这些行为构成了新的基本问题,并产生了新的探究领域。计算机科学似乎是开放式的。
以类似的方式,随着我们获得编辑基因组、合成新生物体的能力,以及更好地理解生物体基因组与其形态和行为之间的关系,生物学领域可能会继续出现新的前沿。类似的事情也可能发生在物理和化学领域,比如可编程物质和新的物质设计阶段。在每一种情况下,新的现象都会以一种开放式的方式提出新的问题。
因此,乐观的观点认为,科学是一个无止境的前沿领域,我们将继续发现甚至创造全新的领域,并提出自己的基本问题。如果我们今天看到增长放缓,那是因为科学仍然过于关注已确立的领域,而在这些领域,取得进展变得越来越困难。我们希望未来会有更多的新领域出现,产生新的重大问题。这是科学加速发展的机会。
最好的时代还是最差的时代?AI和基因编辑技术正在大爆发
《大西洋月刊》内部在讨论上述研究发现时,有不少人坚持认为科学正在经历一个黄金时代。他们拿希格斯粒子和引力波的发现为例,以此作为“科学比以往任何时候都更好”的证据。
这些发现确实是惊人的发现。但前几代人的发现也同样引人注目。例如,将引力波的发现与1915年爱因斯坦广义相对论的发现相比较,广义相对论不仅预测了引力波,而且从根本上改变了我们对空间、时间、质量、能量和重力的理解。引力波的发现虽然在技术上给人留下了深刻的印象,但对改变我们对宇宙的理解却没有多大帮助。
尽管希格斯粒子的发现是了不起的,但与20世纪30年代发现的众多粒子相比,它就相形见绌了。这些粒子包括我们日常生活的主要组成部分之一中子,以及正电子,后者首次揭开了反物质的神秘世界。从某种意义上说,希格斯粒子的发现是非凡的,因为它体现了20世纪上半叶常见的一种状态,但近几十年来很少见。
另一种普遍的反应是,人们说科学比以往任何时候都好,因为他们自己的领域正在取得巨大的进步。比如现在经常听到人工智能(AI)和crispr基因编辑技术。
但是,虽然人工智能、crispr和类似的领域的确在快速发展,不过如果放在整个现代科学史上观察,一直存在着热门或者更受欢迎的领域。
想想从1924年到1928年之间物理学的进步。在这段时间里,物理学家了解到物质的基本成分既有粒子又有波的性质;他们制定了量子力学的定律,导致了海森堡的不确定性原理;他们预测了反物质的存在等等。正如保罗·狄拉克(Paul Dirac)所说,在那个时代,“即使是二流物理学家也能做出一流的发现”。
相比之下,过去几年人工智能的主要发现,包括在识别图像和人类语言能力上的提高,以及玩围棋等游戏的能力,将在未来几十年产生巨大的影响。但要产生这些成果,需要付出更多的时间、金钱和努力,而且,目前尚不清楚,它们是否比20世纪20年代揭示的现实重组更重要。
同样,crispr在过去几年也取得了许多突破,包括修改人类胚胎以纠正一种遗传性心脏疾病,以及制造出能够在整个蚊子种群中传播疟疾抗性基因的蚊子。但是,尽管这样的实验室原理证明是显著的,crispr的长期潜力是巨大的,但最近的结果并不比过去生物学快速进步时期的结果更令人印象深刻。
70年代以来除了计算机和互联网,其他许多技术只是在改进
如果科学的收益递减,这对我们的长期未来意味着什么呢? 是否会有更少的新科学见解来激发在过去一个世纪中重塑我们世界的新技术呢? 事实上,经济学家认为这种情况正在发生,他们称之为生产率放缓。
生产率的增长是经济健康社会的一个标志,人们不断创造出能够提高财富创造能力的想法。坏消息是美国的生产率增长正在下降。自上世纪50年代以来,这一数字一直在下降,当时大约是今天的六倍。这意味着,在过去10年里,我们看到的变化与上世纪50年代18个月里的变化差不多。
这听起来可能令人惊讶。在过去的几十年里,我们没有看到很多发明吗?今天不是加速技术变革的黄金时代吗?
经济学家泰勒•考恩(Tyler Cowen)和罗伯特•戈登(Robert Gordon)辩称,事实并非如此。在他们的著作《大停滞和美国成长的兴衰》中,他们指出,20世纪初使用了许多强大的通用技术:电力、内燃机、无线电、电话、航空旅行、装配线、化肥等等。
相比之下,他们整理的经济数据表明,自上世纪70年代以来,情况几乎没有什么变化。是的,我们已经取得了与两种强大的通用技术相关的进展:计算机和互联网,但其他许多技术只是在逐步改进。
是什么导致了生产率的下降?经济学家对这一问题存在争议,并提出了许多不同的答案。一些人认为,这仅仅是因为现有的生产率衡量方法不能很好地衡量新技术的影响。
《大西洋月刊》提出了另一种解释,即在科学上的支出回报的减少导致了真正的生产率放缓。
但即使很难评估科学工作的重要性,《大西洋月刊》认为,仍有必要进行这样的评估。
并不是说科学家需要强制的KPI,但社会需要依靠这些评估结果来奖励科学发现,并决定应雇用或资助哪些科学家。
-
AI
+关注
关注
87文章
31000浏览量
269333 -
编程语言
+关注
关注
10文章
1945浏览量
34784 -
计算机科学
+关注
关注
1文章
144浏览量
11375
原文标题:科研最好的时代还是最差的时代?尽管AI一骑绝尘,但科学正放缓
文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论