MEGNet普适性图神经网络精确预测分子和晶体性质-电子发烧友网

近年来机器学习算法在包括自然语言处理，图像识别等诸多领域大放异彩。得益于如Materials Project1, QM92,3等材料数据库的不断完善和发展，机器学习正在被越来越多的应用在材料学领域的研究中。然而，由于研究目标的单一性，多数工作仍然局限于解决特定的晶体结构以及特定的材料性质预测问题。一种泛化的，普适性的机器学习模型仍然是材料学领域研究的重点目标。此研究是基于

基于DeepMind建立的图神经网络框架。

MEGNet普适性图神经网络精确预测分子和晶体性质

在材料学领域，对分子或晶体结构的特征描述需要满足平移，转动，镜面不变性，以及对整体结构特异信息的表征。常见的结构特征描述由于其局域性，缺乏对整体结构信息的表达，因而不具有普适性。图网络模型(graph-network)是一种基于图论的结构化模型，从理论上完美解决了这一问题。在图论中，图(graph)由若干给定的顶点(node)及连接顶点的边(edge)构成。运用到分子(或晶体)结构中，原子(atom)可以由顶点(node)描述，连接原子之间的化学键(bond)可以由边(edge)描述，从而可以把一个个分子或晶体结构看作一个个独立的“图”。基于此类模型的结构描述方法，科研工作者可以开发出针对任何材料结构或任何物理化学性质的普适性模型。尽管具有理论可行性，此类模型由于模型复杂度，材料数据量的限制，仍很少被应用在材料学领域中4,5。近日，UC San Diego 的 Shyue Ping Ong 课题组基于DeepMind建立的图神经网络框架6，开发了一套分子和晶体通用性质预测模型(MEGNet)，在各项性质预测测试中达到了领先水平7。

MEGNet普适性图神经网络精确预测分子和晶体性质

图 1. MEGNet 概述。每个分子/晶体结构由化学键信息，原子信息，和状态信息描述。每个结构描述输入模型后，依次更新，直到总的结构输出性质与DFT计算值接近。

图1中描述了该模型的工作模式：每个结构可用三个向量表征，分别包含原子信息，化学键信息，和状态函数信息。在每一次模型训练迭代中，依次更新化学键向量，原子向量，和状态函数向量，得到新的结构表征向量，直到通过该表征输出的性质与DFT计算结果趋于一致。作者首先用QM9 分子数据集中超过130k数据作为训练集训练模型，并用得到的模型预测分子中的13项物理化学性质，在其中的11项中达到同类模型中的最优结果（表1）。更为先进的是，之前的工作对由状态参数关联的状态函数，如内能（U0, U），焓(H)，和吉布斯自由能(G)，采用的是分别训练模型进行预测的方法。

然而本工作中，作者采用加入状态参数作为输入的方法，可由单一模型同时预测U0, U, H和G，并保持与分别模型训练类似的准确度，大大提高了训练效率[YZ1]。在针对晶体结构的应用中，作者用Materials Project数据库中超过69k数据作为训练集，针对生成能，能带带隙，体积模量和剪切模量进行了回归（Regression）分析，并用带隙值作为金属和非金属的判据进行分类(classification)分析。回归分析中的平均绝对误差（MAE）低于同类型模型SchNet4和CGCNN5（表2），金属和非金属分类分析中综合准确率达86.9%，ROC中AUC达到0.926，与此前最优模型CGCNN类似。

表1. 不同模型在QM9上预测13项性质的平均绝对误差（MAE）对比

MEGNet普适性图神经网络精确预测分子和晶体性质

表2. MEGNet和其他基于图像模型

在Materials Project数据集的预测准确度对比

MEGNet普适性图神经网络精确预测分子和晶体性质

在对模型的深入分析中，作者发现，从最优模型中提取出的元素映射（embedding）与化学常识吻合。例如，将元素映射投影二维空间可发现，Eu和Yb与其他镧系元素距离较远，而与碱土金属更接近，这与化学经验相符。这样的分析一方面佐证了模型可以学习到可靠的化学信息，另一方面可将学习到的化学信息用于迁移学习，以大大降低训练新模型训练所需数据量。例如，在此例中，作者通过用~69k生成热的数据训练的模型提取的元素映射，用于预测带隙和弹性性质的模型训练，后者的数据量只有生成热的一半甚至十分之一。通过迁移学习的方法作者得到比直接训练更低的MAE和提高两倍的收敛速度。这为小数据量的性质的高效准确模型训练提供了可行的方案。

在模型的使用方面，用户可登陆http://megnet.crystals.ai，根据提示输入晶体结构编码或cif文件即可得到模型预测的性质。另外，文章所涉及的Python代码均已开源（https://github.com/materialsvirtuallab/megnet.git）。下面示例如何使用已有模型和训练新的模型。

1示例一：使用分子模型

MEGNet普适性图神经网络精确预测分子和晶体性质

2示例二：使用晶体模型预测剪切模量

MEGNet普适性图神经网络精确预测分子和晶体性质

3示例三：训练新模型

MEGNet普适性图神经网络精确预测分子和晶体性质

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4772

浏览量
100857
机器学习

机器学习

+关注

关注
66

文章
8422

浏览量
132743

原文标题：MEGNet普适性图神经网络，精确预测分子和晶体性质

文章出处：【微信号：zhishexueshuquan，微信公众号：知社学术圈】欢迎添加关注！文章转载请注明出处。

BP神经网络预测模型的建模步骤

BP（Backpropagation）神经网络是一种多层前馈神经网络，其核心思想是通过反向传播算法来调整网络中的权重和偏置，从而实现对输入数据的预测或分类。BP

发表于 07-11 16:57 •1573次阅读

python做bp神经网络预测数据

BP神经网络（Backpropagation Neural Network）是一种多层前馈神经网络，通过反向传播算法进行训练。它在许多领域，如模式识别、数据挖掘、预测分析等，都有广泛的应用。本文将

发表于 07-11 10:54 •1307次阅读

bp神经网络预测模型建模步骤

BP神经网络（Backpropagation Neural Network）是一种多层前馈神经网络，其核心思想是通过反向传播算法来调整网络中的权重和偏置，从而实现对输入数据的预测或分类

发表于 07-11 10:52 •532次阅读

BP神经网络和人工神经网络的区别

BP神经网络和人工神经网络（Artificial Neural Networks，简称ANNs）之间的关系与区别，是神经网络领域中一个基础且重要的话题。本文将从定义、结构、算法、应用及未来发展等多个方面，详细阐述BP

发表于 07-10 15:20 •1135次阅读

神经网络预测模型的构建方法

神经网络模型作为一种强大的预测工具，广泛应用于各种领域，如金融、医疗、交通等。本文将详细介绍神经网络预测模型的构建方法，包括模型设计、数据集准备、模型训练、验证与评估等步骤，并附以代码

发表于 07-05 17:41 •681次阅读

rnn是递归神经网络还是循环神经网络

RNN（Recurrent Neural Network）是循环神经网络，而非递归神经网络。循环神经网络是一种具有时间序列特性的神经网络，能够处理序列数据，具有记忆功能。以下是关于循环

发表于 07-05 09:52 •588次阅读

rnn是什么神经网络模型

RNN（Recurrent Neural Network，循环神经网络）是一种具有循环结构的神经网络模型，它能够处理序列数据，并对序列中的元素进行建模。RNN在自然语言处理、语音识别、时间序列预测等

发表于 07-05 09:50 •625次阅读

人工神经网络模型的分类有哪些

人工神经网络（Artificial Neural Networks, ANNs）是一种模拟人脑神经元网络的计算模型，它在许多领域，如图像识别、语音识别、自然语言处理、预测分析等有着广泛的应用。本文将

发表于 07-05 09:13 •1258次阅读

递归神经网络是循环神经网络吗

递归神经网络（Recurrent Neural Network，简称RNN）和循环神经网络（Recurrent Neural Network，简称RNN）实际上是同一个概念，只是不同的翻译方式

发表于 07-04 14:54 •798次阅读

神经网络预测误差大小怎么看

神经网络预测误差大小是衡量神经网络性能的重要指标之一。本文将介绍如何评估神经网络预测误差大小，包括误差的定义、评估方法、误差分析以及误差优化

发表于 07-03 10:41 •1155次阅读

如何使用神经网络进行建模和预测

神经网络是一种强大的机器学习技术，可以用于建模和预测变量之间的关系。 神经网络的基本概念 神经网络是一种受人脑启发的计算模型，由大量的节点（神经

发表于 07-03 10:23 •775次阅读

bp神经网络和卷积神经网络区别是什么

BP神经网络（Backpropagation Neural Network）和卷积神经网络（Convolutional Neural Network，简称CNN）是两种不同类型的人工神经网络，它们在

发表于 07-03 10:12 •1226次阅读

bp神经网络模型怎么算预测值

BP神经网络（Backpropagation Neural Network，简称BP网络）是一种多层前馈神经网络，它通过反向传播算法来调整网络中的权重和偏置，从而实现对输入数据的

发表于 07-03 09:59 •796次阅读

卷积神经网络和bp神经网络的区别

卷积神经网络（Convolutional Neural Networks，简称CNN）和BP神经网络（Backpropagation Neural Networks，简称BPNN）是两种

发表于 07-02 14:24 •4247次阅读

了解如何使用PyTorch构建图神经网络

图神经网络直接应用于图数据集，您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类

发表于 02-21 12:19 •785次阅读

搜索历史

MEGNet普适性图神经网络精确预测分子和晶体性质

评论

BP神经网络预测模型的建模步骤

python做bp神经网络预测数据

bp神经网络预测模型建模步骤

BP神经网络和人工神经网络的区别

神经网络预测模型的构建方法

rnn是递归神经网络还是循环神经网络

rnn是什么神经网络模型

人工神经网络模型的分类有哪些

递归神经网络是循环神经网络吗

神经网络预测误差大小怎么看

如何使用神经网络进行建模和预测

bp神经网络和卷积神经网络区别是什么

bp神经网络模型怎么算预测值

卷积神经网络和bp神经网络的区别

了解如何使用PyTorch构建图神经网络

搜索历史

MEGNet普适性图神经网络 精确预测分子和晶体性质

评论

MEGNet普适性图神经网络精确预测分子和晶体性质