/ ai资讯

AI4S科学研究的超能力时代是否已成必然

发布时间:2025-01-20 09:46:03

人类科研范式的巨变或将是螺旋式上升的过程,它充满了探索、挑战与革新。

世界上第一台受专利保护的计算机

人类历史上得到普遍认可的较早期的机械式计算机之一,是1642年法国哲学家兼数学家布累斯·帕斯卡发明的加法器(Pascaline)。

帕斯卡发明它的目的,是帮助父亲减少税务计算上的劳作。而此后,二进制和微积分的发明者莱布尼茨在加法器的基础上,发明了人类第一台可进行四则运算的机械计算机。

最早的计算机的诞生是让数学家从繁冗、人力所不能及的数学计算中解脱,但因摩尔定律加持之下,人类计算能力得以快速增加,这是它被用于科研进而迈进公众生活的一个前提。

然而,科研历程中的一个关键性里程碑,便是成功攻克了“四色问题”。

数学界有名的四色问题

四色问题的起源将追溯到1852年,由英国数学家弗朗西斯·古德里(Francis Guthrie)提出。他在为英国地图着色时,发现只需四种颜色就可确保相邻区域颜色不同,随后他向弗雷德里克·古德里(Frederick Guthrie)提出此问题。

其真正引起广泛关注是在1878年,当时英国数学家阿瑟·凯莱(Arthur Cayley)在伦敦数学学会上公开提出了这个问题,并将其列为未解决的数学难题之一。

在19世纪末和20世纪初,许多数学家尝试证明四色问题,但都未能成功。例如,阿尔弗雷德·肯普(Alfred Kempe)在1879年提出了一种证明方法,并一度被认为解决了问题。因此,11年后,珀西·约翰·希伍德(Percy John Heawood)发现肯普证明中的错误,表明四色问题仍未解决,这事件进一步加深了数学界对四色问题的质疑,甚至有人认为它可能是一个无法被证明的假说。

四色猜想的推理证法

直到1976年,肯尼斯·阿佩尔(Kenneth appel)和沃尔夫冈·哈肯(Wolfgang Haken)利用计算机辅助证明,才首次给出了四色问题的完整证明。其次,他们的证明方法也引发了争议,因其依赖于计算机对大量具体案例的枚举和验证,而非传统的纯数学推导。

与此同时,这种非传统的证明方式使得部分数学家对四色问题的“真正解决”持保留态度,甚至质疑其是否能被视为严格的数学证明。

另外,比四色问题的解决更具有标志性意义的,是现代计算机科学的最前沿:人工智能技术与科学的结合,而其代表事件则是2024年诺贝尔化学奖的颁发。

这次由三人分享的化学奖中,来自谷歌的英国科学家哈萨比斯和江珀,他们开发了一种名为AlphaFold2的人工智能模型,这种模型解决了一个已有50年历史的难题,能够预测大约两亿种已知蛋白质的复杂结构,并且已被全球200多万人使用。(往期文章提到过)

物理学奖颁给AI科学家,诺贝尔奖不走“寻常路”?

但由于AlphaFold的出现改变许多,其Fold指“折叠”——2018年,AlphaFold采用深度学习基础上的FM预测策略,通过三个系统支撑(建模、预测、优化),出道就拿下当年蛋白质预测大奖;在2020年改进后的模型AlphaFold2在第14届CASP竞赛上让人“眼前一亮”,在给定预测蛋白质中GDT平均得分92.4,远超竞争对手。

至此,深度学习支撑下的蛋白质预测取得历史性进展,也开始消融TFM和FM之间的间隔,人类对于蛋白质结构预测乃至设计的能力得到极大增强。

AlphaFold1的预测过程

简而言之,AI for Science,AI4S已成为常态,而去年的诺贝尔奖更像是一个明确的信号,无疑使得人类再一次站到了科研范式的转折点上;被简化为“AI4S”的AI for Science(AI用于科研)理念也受到了国内外科学家们的重点关注。

科学智能(AI for Science,AI4S),是指人工智能技术驱动的科学研究,主应用于探索未知的科学领域。AI4S概念由中国科学院院士、北京大学教授鄂维南于2018年首次提出。

此外,AI4S开启了一种利用人工智能学习深奥的科学原理来创造科学模型,以解决那些曾被认为无解的实际问题的科研新范式。2021年,随着英国“深度思维”(DeepMind)公司发布阿尔法折叠(AlphaFold),AI4S成为全球关注的焦点。

值得注意的是,AI4S的核心源于数据驱动、模型智能和跨域融合,它能够处理传统方法难以应对的高维、非线性问题,在海量数据中识别人类难以察觉的模式和关联。

数据处理维度:深度学习算法能够从海量实验数据中提取特征,发现传统统计方法无法识别的模式。

模型构建维度:物理信息神经网络(PINN)等新型建模方法,将物理定律与数据驱动相结合,实现了更精确的模型预测。

实验设计维度:强化学习算法能够自主设计实验方案,优化实验参数,大幅度提高实验效率。

当前,AI4S的显著特点是使用人工智能、机器学习和推理技术来处理和分析大数据,有效揭示数据之间的相互关系,并帮助科学家解决“维数诅咒”问题,从而更快、更准确地理解复杂现象,其核心也是“知识自动化”,与“工业5.0”的目标相契合。

图源:Google

首先,这三类技术的融合,与卡尔·波普尔的三个世界——物理世界、精神世界和人工世界相呼应,这相比于大语言模型和大视觉模型(LVMs)代表了更广阔的世界模型(World Model)视角。

其中,大模型技术表明,改造工业和科学研究最直接、最自然的方法是通过真实系统和人工系统的平行化,这包括从自然科学到人工科学的转变,从物质生产到人工制造的转型等协同与合作。

其次,科学研究正从“大问题,大模型”转向“小问题,大模型”,并在特定领域进行垂直分割。这一趋势,伴随大型模型的持续进步和智能代理(agent)技术的成熟,催生了新型“数字人科学家”的出现,他们专注于科学研究中的“小问题,大模型”。

或许,AI4S范式转换期必然伴随着更多的困难与挑战。

科学哲学家托马斯·库恩的经典著作《科学革命的结构》被奉为圭臬,他也被公认为20世纪最具影响力的科学哲学家之一。

库恩的核心思想围绕“范式理论”展开,这一理论为理解时代进步提供了全新的视角。这意味着,库恩认为,在特定时代或领域中,只存在一个主导性的“主范式”,只有与之契合才能站在历史发展的正确方向。

因此,范式本身具有强大的惯性,每一次新范式的转换都需付出努力并承受相应的代价。

由于篇幅受限,本次的AI4S就先介绍这么多......

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com