0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何发现AI+Science中的下一个AlphaFold和ChatGPT?

bzdlyqxsl 来源:信息与电子工程前沿FITE 2023-04-21 09:56 次阅读

导语

从微观到宏观,跨越广阔的空间和时间尺度,AI + Science 在发现基本粒子、量子计算、蛋白质模拟、材料设计、可控核聚变、气象预测、碳捕捉等政策设计、探索浩瀚宇宙等各个方面,都发挥着重要作用。一方面,各个科学领域中的重大问题为 AI 研究带来全新的挑战和机会;另一方面,最新的 AI 技术为解决科学领域的问题提供了强大的工具。

在集智俱乐部 AI + Science 读书会第一期,斯坦福大学计算机科学系博士后研究员吴泰霖从 AI for Science 和 Science for AI 两个方向,探讨为何要将 AI 与 Science 结合,以及 AI + Science 下一步关注的重要问题和未来面对的挑战。今天的文章整理自此次分享。

本文由第一期 AI + Science 读书会第一期总结而成。在此次分享中,讲者吴泰霖主要就以下几个方面展开论述:

我们为什么要讨论 AI + Science?

AI for Science 关注的核心问题,以及前沿进展有哪些;

Science for AI 领域的核心问题,以及前沿进展有哪些;

AI + Science 下一步关注什么问题?

1. 我们为什么要讨论 AI + Science ?

AI + Science 这一领域可以分为 AI for Science 和 Science for AI 两个部分。前者指利用AI技术为科学发现赋能,后者指利用科学知识设计出更强大的AI技术。 在 AI for Science 部分,许多前沿的AI技术可以帮助科学发现,主要包括: 1)在数值模拟方面提升速度和准确性。如 DeepMind 提出的 GraphCast[1] 能通过输入60秒的历史天气,预报未来10天的天气,不仅在准确度上极大优于传统预测手段,在运算效率上也有极大的提升。AlphaFold [2] 的提出将人类蛋白质结构预测的准确度提升到了前所未有的水平。 2)帮助科学家探索科学框架的设计。我们可以让AI去更大的设计空间搜索设计策略和控制优化策略。比如近期发表在Nature 上的工作,使用深度强化学习控制核聚变反应中的等离子体,第一次发现了全新的等离子体结构[3]。 3)揭示未发现的科学定律和知识。比如近年的工作 AI Feynman2.0[4],让AI重新发现了《费曼物理学讲义》中的100个物理方程,甚至还发现了新的方程。这类工作可能在很大程度上可以做到帮助人类加快科学发现。 更进一步来说,科学技术的进步对于人类而言,是解放生产力以及获得可持续增长的重要方式之一。

[1]Lam, Remi, et al. "GraphCast: Learning skillful medium-range global weather forecasting." arXiv preprint arXiv:2212.12794 (2022). [2]Lumper, John, et al. "Highly accurate protein structure prediction with AlphaFold." Nature 596.7873 (2021): 583-589 [3]Degrave, Jonas, et al. "Magnetic control of tokamak plasmas through deep reinforcement learning." Nature 602.7897 (2022): 414-419 [4]AI Feynman 2.0 [1]: rediscover top-100 physics equations in Feynman lectures

在 Science for AI 方面,当前的科学也可以为促进AI的发展提供非常有效的帮助,为AI技术带来了新的挑战。如许多物理、化学等科学问题面临超大的状态空间搜索,当前的AI技术无法很好地解决。如何解决这些科学问题,对AI的发展提出了更大挑战。 其次,基于一些科学先验知识,我们也可以设计出更强大的AI模型,在这方面已经有了很多工作。比如等变图网络[5]的提出,就是启发于物理中的对称性,使得模型可以在药物分子建模等方面满足需求。同样在模型中引入对称性的工作还有[6],在不同的系统中都极大提高了分子动力学模拟器的性能。另外还有扩散模型[7]、能量模型[8]等,都对神经网络的建模提供了启发。

[5] Victor Garcia Satorras, Emiel Hoogeboom, Max Welling,E(n) Equivariant Graph Neural Networks [2022] [6] Zhang L, Han J, Wang H, et al. Deep potential molecular dynamics: a scalable model with the accuracy of quantum mechanics. Physical review letters, 2018, 120(14): 143001. [7] Sohl-Dickstein J, Weiss E, Maheswaranathan N, et al. Deep unsupervised learning using nonequilibrium thermodynamics. [8] Greydanus, Samuel, Misko Dzamba, and Jason Yosinski. "Hamiltonian neural networks." Advances in neural information processing systems 32 (2019)

AI 和 Science 的结合是一种双向的赋能,我们当前还有许多事情可以做。下面本文将对上述提到的内容进一步详细展开论述。

2.AIfor Science

一方面是AI对科学的赋能。首先我们可以对科学做一个分解,这个过程首先是发现科学定律,并据此建立模型,这个过程在传统范式中往往非常依赖科学家个人的洞察力,如开普勒定律和牛顿定律等;然后我们会根据这一模型去模拟真实世界,解释更大范围的事物;最后,我们会尝试设计出新的系统,比如修改模型的参数,或者对系统进行实验和干预等,对系统进行控制,对系统产生进一步的了解,从而为进一步的科学发现创造条件。 而在机器学习中同样也存在这样类似的步骤:通过数据驱动的方式发现一个模型;使用模型对系统进行模拟;最后可以通过控制等方式设计出新的系统。所以这二者的相似性就可以引出AI如何赋能科学的三个方面:科学仿真(Simulation)、科学设计(design)、科学发现(discovery)。

df2050d2-dfcc-11ed-bfe3-dac502259ad0.png

图1. 科学仿真、科学设计与科学发现三阶段与机器学习的对应 2.1 AI 之于科学仿真 科学仿真是指用数值模拟的形式,在给定系统初始状态,边界条件以及参数的时候,模拟系统的动力学或者稳态。而通过引入机器学习的方法,模拟的速度和精度都会得到极大的提高。

df292310-dfcc-11ed-bfe3-dac502259ad0.png

图2. 动力系统仿真示意图。μt是系统的初始状态,可以是一个连续函数,或者一个图;f*是演化动力学,可以是偏微分方程的演化,或者是真实世界的演化;a 是系统不随时间变化的静态参数;∂X是系统的边界条件。

在科学仿真过程中,我们首先关心的问题是希望做到精确模拟。我们可以用传统的方式,基于第一性原理建立偏微分方程,然后求解。这样做的好处是解释性高,并且求解精度有理论保证。但缺陷是运算慢,而且对于很多复杂的系统,可能难以求解,甚至难以写出偏微分方程。 我们也可以考虑用纯数据驱动的方式,将图1中的f*动力学参数化,用神经网络强大的拟合能力学习出一个f(θ),使其尽可能接近真实的动力学。 不过,一个更好的方式是,我们可以取两者的长处,即保留神经网络的运算能力,同时也加入一些物理先验信息对神经网络结构进行约束,或者使用更符合物理直觉的训练方式,使得模型的表现更好。 比如图神经网络通过引入图结构的先验信息,即事先给定微观粒子之间的相互作用关系,从而提升神经网络的预测能力。这里就我们以一系列基于GNN的工作为例,展开论述GNN在科学仿真领域的进展。 首先是 DeepMind 提出了一种图网络模拟器(Graph Network Simulator,GNS)[8],模拟粒子物理系统,可以应用于流体力学或者计算图形学等领域的模拟。具体架构如下图所示。首先根据先验信息建立一个图,然后基于消息传递(Message Passing)机制更新节点的特征,这里的“消息”可以代表粒子之间的相互作用关系,通过神经网络的映射,实现粒子状态的更新,最终实现模拟粒子通过相互作用发生运动的动力学过程。

df2e752c-dfcc-11ed-bfe3-dac502259ad0.png

图3. 使用图神经网络模拟复杂系统。| 图片来源: Sanchez-Gonzalez et al. Learning to Simulate Complex Physics with Graph Network. ICML 2020. http://proceedings.mlr.press/v119/sanchez-gonzalez20a/sanchez-gonzalez20a.pdf

随后提出的 HGNS (Hybrid Graph Network Simulator)方法 [9] 则通过引入多步预测,和 sector-based 训练技巧,使得神经网络可以在更加复杂的系统上进行模拟。前文提到的天气预报模型 GraphCast[1],则进一步引入多尺度信息,从而实现大规模和大尺度的预测效果。 另外一个基于网格的仿真(mesh-based simulation)也使用了图网络建模[10],它们除了引入网格网络之外,还基于位置信息引入了不同网格之间的相互作用。这种建模方式也被证明在网格数据中有非常好的预测效果。这篇工作发表在了2021年的 ICLR 上。而后续也有对其进行的改进工作,比如通过引入一个调控参数,用来平衡预测准确度与预测精度[11]。

df464de6-dfcc-11ed-bfe3-dac502259ad0.png

当然该领域还有一系列其他优秀的工作,比如基于对称性提出的等变图网络(equivariant graph)[5],引入动量守恒的约束从而提高准确度[6, 12]。而除了图神经网络之外,还有可以引入无限维函数(infinite dimensional function)建模状态空间,引入傅里叶神经算子[13]等等,无法在此穷举展示。

[8]Sanchez-Gonzalez et al. Learning to Simulate Complex Physics with Graph Network. ICML 2020. [9] Wu, Tailin, et al. "Learning large-scale subsurface simulations with a hybrid graph network simulator." SIGKDD 2022 [10]Lam C Y, Lu J R, Udalski A, et al. An Isolated Mass-gap Black Hole or Neutron Star Detected with Astrometric Microlensing[J]. The Astrophysical Journal Letters, 2022, 933(1): L23. 11]Pfaff, Tobias, et al. "Learning mesh-based simulation with graph networks." ICLR 2021 [11]Wu T, Wang Q, Zhang Y, et al. Learning large-scale subsurface simulations with a hybrid graph network simulator. Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2022: 4184-4194. [12]Prantl L, Ummenhofer B, Koltun V, et al. Guaranteed Conservation of Momentum for Learning Particle-based Fluid Dynamics. NeurIPS 2022 [13]Li, Zongyi, et al. "Fourier neural operator for parametric partial differential equations." ICLR2021

在仿真领域,我们关心的另一个问题是,求解出系统的稳定状态。这在材料、凝聚态物理等领域是非常重要的问题。对于这类问题,模型的输入就是一个边界条件,输出就是系统的稳态。比如像蛋白质折叠问题,我们关心的是最终结构,而不关心折叠的过程。一个好的方法就是使用神经算子(neural operators)进行求解[14-16]。

df522e7c-dfcc-11ed-bfe3-dac502259ad0.png

图4. 根据系统边界条件和参数,求解系统稳定状态图示

[14]Li, Zongyi, et al. "Fourier neural operator for parametric partial differential equations." ICLR2021 [15] Li, Zongyi, et al. "Neural operator: Graph kernel network for partial differential equations." arXivpreprint arXiv:2003.03485 (2020). [16]Raissi et al., Journal of Computational physics 378 (2019): 686-707

关于科学仿真这个大领域,除对于科学问题来说有重要意义之外,其实背后还有更大的图景。比如数字孪生,我们可以设想在制造业中造一个数字孪生体,完全模拟生产过程的发动机结构、系统状态、系统演化等等整个流程,从而实现对系统进行实时监测和调控。

df5ae594-dfcc-11ed-bfe3-dac502259ad0.png

图5. 数字孪生和元宇宙 2.2 AI 之于科学设计 对于科学设计,在此处可以定义为,我们设置一个目标,希望可以通过某些方式,让神经网络自动找到可以实现这一目标的初始条件,如蛋白质结构设计;或者找到边界条件,如设计飞机的形状;亦或者外部控制条件,如调控全球变暖。

df66669e-dfcc-11ed-bfe3-dac502259ad0.png

图6. 科学设计的框架图 具体实现方式包括如下几种: a) 可以用学习好的模拟器作为一个内部优化循环,实现边界条件的确定。比如前文提到的,基于图网络的模拟器GNS就属于这类方法 [8]。

df745d8a-dfcc-11ed-bfe3-dac502259ad0.png

图7. GNS实现粒子运动路径的优化 b) 可以通过迭代的形式实现收敛,如 diffusion model,从一个随机分布开始,最终收敛到我们想要的分布。工作[17]是使用几何图网络(Geomeric Graph Neural Network),结合扩散模型实现等变图的生成任务。对药物生成有很强的现实意义。

df9cc9be-dfcc-11ed-bfe3-dac502259ad0.png

图8. 基于扩散模型的等变图生成 c) 可直接映射,比如使用 transformer 直接学习边界条件或者系统参数到目标的映射 [18]。

dfae0706-dfcc-11ed-bfe3-dac502259ad0.png

图9. 直接映射 d) 通过强化学习直接设计系统本身 [19,20],比如在分子设计这一任务上,可以通过强化学习的方式逐一加入原子。还有前面提到的系统控制等任务,也是强化学习的强项。

dfba7d2e-dfcc-11ed-bfe3-dac502259ad0.png

图10. 基于强化学习的系统设计 而实际使用也并不局限于以上提到的方法和模型。并且同样,AI对于科学设计的增强也使得我们解决数字孪生这样的大问题有了进一步潜力。

[17]Xu, Minkai, et al. "Geodiff: A geometric diffusion model for molecular conformation [18]Guo, Ruchi, Shuhao Cao, and Long Chen. "Transformer meets boundary value inverse problems." NeurIPS 2022 [19]You, Jiaxuan, et al. "Graph convolutional policy network for goal-directed molecular graph generation." Advances in neural information processing systems 31 (2018). [20]Degrave, Jonas, et al. "Magnetic control of tokamak plasmas through deep reinforcement learning." Nature 602.7897

2.3 AI 之于科学发现 科学家是如何实现科学发现的呢。伽利略发现单摆周期规律的过程,首先是通过观察教堂的台灯摆动为灵感,发现台灯的摆动周期是固定的,并且和摆动的幅度没有关系。然后他将这一过程抽象为了一个单摆运动,在这一系统上总结出了一些定量的规律。最后,再将这一过程向所有类似的系统中进行泛化。 所以,根据这一例子我们可以总结来看,科学发现的步骤可以大致分为:概念的发现,规律的总结,以及概念的泛化这几个步骤(如图11所示):

dfc7b728-dfcc-11ed-bfe3-dac502259ad0.png

图11. 科学发现的环节及其之间的关系 首先第一个步骤,发现概念、表示或者性质。比如我们需要对细胞的分类进行辨识、分类、表示,或发现系统的因果结构,或者发现系统的对称性等性质等等。而AI在表征学习、分类学习、因果发现等领域都能够帮助我们在这一个步骤的能力得到增强。近期刘子鸣等人的工作使用机器学习算法发现了守恒律 [21]。 其次是发现概念之间的关系,即物理定律发现的过程。我们也可以使用数据驱动的方式发现公式。这里涉及到符号回归相关的技术,也有了相当一部分的工作,比如前文提到的AI费曼2.0等 [22-24]。 最后是概念的泛化。这可以对应的例子是,将能量模型(Energy-based model)累加后得到更复杂的模型[25,26],从而获得更好的效果。以及 few-shot 学习[27],大模型中上下文学习的使用等 [28],都可以做到将模型泛化到更复杂的概念和使用场景中。

dfd1f27e-dfcc-11ed-bfe3-dac502259ad0.png

图12. 使用符号回归发现物理定律。| 来源:Udrescu, Silviu-Marian, et al. "AI Feynman 2.0: Pareto-optimal symbolic regression exploiting graph modularity." NeurIPS 2020 https://arxiv.org/abs/2006.10782

[21]Liu, Ziming, and Max Tegmark. "Machine learning conservation laws from trajectories." Physical Review Letters 126.18 (2021): 180604. [22]Udrescu, Silviu-Marian, et al. "AI Feynman 2.0: Pareto-optimal symbolic regression exploiting graph modularity." NeurIPS 2020 [23] Wu, Tailin, and Max Tegmark. "Toward an artificial intelligence physicist for unsupervised learning." Physical Review E 100.3 (2019): 033311. [24] Mundhenk, Terrell, et al. "Symbolic regression via deep reinforcement learning enhanced genetic programming seeding." NeurIPS 2021 [25] Du, Yilun, Shuang Li, and Igor Mordatch. "Compositional visual generation with energy based models." NeurIPS 2020 [26] Wu, Tailin, et al. "Zeroc: A neuro-symbolic model for zero-shot concept recognition and acquisition at inference time." NeurIPS 2022 [27] Cao, Kaidi, Maria Brbic, and Jure Leskovec. "Concept learners for few-shot learning." ICLR 2021 [28] Brown, Tom, et al. "Language models are few-shot learners." NeurIPS 2020

3. Science for AI

对于科学增强AI这一部分内容,核心观点在于,我们可以将科学中的很多概念或定律作为先验知识或约束引入AI模型,使得模型表现出更强大的效果,图5展示了部分科学概念引入AI模型,并为AI模型取得重大突破的例子。 在读书会后续的分享中,会展开介绍其中一些重要的分支。比如物理启发的生成模型,包括能量模型、扩散模型、量子生成模型等[29],以及一些物理启发的学习理论,如相变、场论等理论启发的学习模型[30]。

dfd94470-dfcc-11ed-bfe3-dac502259ad0.png

dff71d6a-dfcc-11ed-bfe3-dac502259ad0.png

图13. 科学概念对于AI模型的增强

[29] Xu, Yilun, et al. "Poisson flow generative models." NeurIPS 2022 [30] Liu, Ziming, et al. "Towards understanding grokking: An effective theory of representation learning." Advances in Neural Information Processing Systems 35 (2022): 34651-34663.

4. AI + Science 下一步关注什么问题?

AI+Science是一个逐渐兴起的研究方向。在这个领域我们接下来应该关注的是什么问题呢?讲者认为,一个足够重要且有潜力的问题应该满足以下几个条件:

1)普适且影响深远。也就是说这个问题的解决方案可以被用于解决其他很多问题。

2)这个问题本身可能目前看起来是模糊的,但在2-3年内是有希望解决的;

3)有充足的数据;

4)有明确的评价目标; 可以看到,像 ChatGPT 和 AlphaFold 其实都满足这样的条件,现如今它们也确实成为了AI技术的现象级产品。或许沿着这一思路,下一个 ChatGPT 和 AlphaFold 也将很快出现。吴泰霖老师也在分享时提出了自己的想法:我们是否能够创建一个集成平台,我们只需要给出一些文本命令或者函数形式,这个平台就能够自动设计出符合我们要求的系统,比如发动机的形状,或者给出系统最优的参数等。 AI + Science 正方兴未艾,AI和科学的结合仅被挖掘出了冰山一角,而AI的迅速发展又能给二者结合的效能提供强有力的潜力。对于AI + Science,这是一个最好的时代。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267911
  • ai技术
    +关注

    关注

    1

    文章

    1250

    浏览量

    24166
  • ChatGPT
    +关注

    关注

    29

    文章

    1540

    浏览量

    7317

原文标题:如何发现 AI+Science 中的下一个 AlphaFold 和 ChatGPT?

文章出处:【微信号:信息与电子工程前沿FITEE,微信公众号:信息与电子工程前沿FITEE】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    农业、环保等,为人类社会的可持续发展做出贡献。 总结 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们展示了
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    for Science的技术支撑”的学习心得,可以从以下几个方面进行归纳和总结: 1. 技术基础的深入理解 在阅读第二章的过程,我对于AI for Science所需的技术基础有了
    发表于 10-14 09:16

    AI for Science:人工智能驱动科学创新》第章人工智能驱动的科学创新学习心得

    的发展机遇。同时,这也要求科研人员、政策制定者和社会各界共同努力,构建健康、包容的AI科研生态系统。 总之,《AI for Science
    发表于 10-14 09:12

    使用tSPI协议减少下一个多电机BLDC设计的布线

    电子发烧友网站提供《使用tSPI协议减少下一个多电机BLDC设计的布线.pdf》资料免费下载
    发表于 09-26 10:40 0次下载
    使用tSPI协议减少<b class='flag-5'>下一个</b>多电机BLDC设计的布线

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    、污染治理、碳减排三方面介绍了人工智能为环境科学引入的新价值和新机遇。 第8章探讨了AI for Science在快速发展过程面临的机遇和挑战,并对“平台科研”模式进行了展望。
    发表于 09-09 13:54

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前迈出的大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示,OpenAI展示该模型的高级
    发表于 05-27 15:43

    谷歌DeepMind发布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日发布了人工智能模型AlphaFold的最新版本——AlphaFold 3,这革命性的工具将在药物发现和疾病治疗领域发挥巨大作用。
    的头像 发表于 05-10 11:26 525次阅读

    谷歌DeepMind推出新代药物研发AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了款名为AlphaFold 3的全新药物研发AI模型,这创新技术将为科学家们提供前所未有的帮助,使他们能更精确地理解疾病机制,进而开发出更高效的
    的头像 发表于 05-10 09:35 343次阅读

    在FPGA设计是否可以应用ChatGPT生成想要的程序呢

    当下AI人工智能崛起,很多开发领域都可看到ChatGPT的身影,FPGA设计,是否也可以用ChatGPT辅助设计呢?
    发表于 03-28 23:41

    高速风筒的下一个风口是直发吹风机?【其利天下技术】

    去年12月,戴森公司推出款宣称“在吹干湿发的同时实现头发拉直效果”的吹风直发器,解决了‘先吹发,后造型’的用户痛点,引发了行业内外广泛关注热议。这款吹风直发器在电吹风行业尚属首例,确实是
    的头像 发表于 03-25 21:13 1117次阅读
    高速风筒的<b class='flag-5'>下一个</b>风口是直发吹风机?【其利天下技术】

    华为正接洽收购高合汽车 目标“打造下一个赛力斯”?

    工汽车网获悉,2月27日,在片唱衰高合汽车的舆论浪潮下,网络上又出现了华为正接洽收购高合汽车,并且目标“打造下一个赛力斯”的消息。
    的头像 发表于 02-28 14:14 840次阅读
    华为正接洽收购高合汽车 目标“打造<b class='flag-5'>下一个</b>赛力斯”?

    【国产FPGA+OMAPL138开发板体验】(原创)6.FPGA连接ChatGPT 4

    访问ChatGPT 4这样的AI模型是非常复杂的,因为这涉及到大量的数据传输、协议实现、并行处理、优化等等。更重要的是,ChatGPT 4这样的模型通常是运行在强大的服务器集群上。不过,我可以写
    发表于 02-14 21:58

    AI Agent:大模型的下一个高地

    关于AI的想象力
    的头像 发表于 01-15 12:36 378次阅读
    <b class='flag-5'>AI</b> Agent:大模型的<b class='flag-5'>下一个</b>高地

    从数据到生成式AI,是该重新思考风险的时候了

    AI大模型成下一个 安全新战场
    的头像 发表于 12-11 14:36 239次阅读

    晶体管的下一个25年

    晶体管的下一个25年
    的头像 发表于 11-27 17:08 583次阅读
    晶体管的<b class='flag-5'>下一个</b>25年