网站建设方案书模板,自己建网站做app,招聘小程序源码,个人做网站可以吗2017-PMLR-Neural Message Passing for Quantum Chemistry Paper: https://arxiv.org/pdf/1704.01212.pdf Code: https://github.com/brain-research/mpnn
量子化学的神经信息传递
这篇文献作者主要是总结了先前神经网络模型的共性#xff0c;提出了一种消息传递神经网络提出了一种消息传递神经网络MPNN的单一通用框架并在此框架内探索其他新颖的变化。在重要的分子性质预测基准上使用MPNN展示了最先进的结果。 MPNN框架如下图所示
主要贡献 开发了一种MPNN可在所有13个目标上实现最先进的结果并预测13个目标中11个目标的DFT在化学精度范围内。 开发了几种不同的MPNN可以预测DFT在13个目标中的5个的化学精度范围内同时仅对分子的拓扑结构进行操作没有空间信息作为输入。 开发了一种通用方法用于训练具有更大节点表示的 MPNN而不会相应增加计算时间或内存与以前的高维节点表示的 MPNN 相比节省了大量成本。
消息传递神经网络
MPNN模型节点特征 xvx_vxv和边缘特征 evwe_{vw}evw 的无向图 GGG 。正向传递有两个阶段消息传递阶段和Readout阶段。消息传递阶段运行T个时间步长并根据消息函数MtM_tMt和顶点更新函数UtU_tUt进行定义。在消息传递阶段图中每个节点的隐藏状态 hvth^t_vhvt根据消息 mvt1m^{t1}_vmvt1根据 其中在总和中N(v)N (v)N(v) 表示图 GGG 中 vvv 的邻居。readout阶段使用一些Readout函数 RRR 根据 消息函数 MtM_tMt、顶点更新函数 UtU_tUt和readout函数 RRR 都是学习的可微函数。RRR 在节点状态集上运行并且必须对节点状态的排列不变以便 MPNN 对图同构不变。作者通过指定使用的消息函数 MtM_tMt、顶点更新函数 UtU_tUt 和readout函数 RRR来定义文献中的先前模型。
先前模型
用于学习分子指纹的卷积网络门控图神经网络交互网络分子图卷积深度张量神经网络基于拉普拉斯方法
MPNN 变体
作者使用 ddd 来表示图中每个节点的内部隐藏表示的维度并使用 nnn来表示图中节点的数量。对 MPNN 的实现通常运行在有向图上具有用于传入和传出边缘的单独消息通道在这种情况下传入消息 mvm_vmv是 mvinm^{in}_vmvin和 mvoutm^{out}_vmvout的串联。将该图视为有向图其中每个原始边都成为具有相同标签的传入边和传出边。请注意边的方向没有什么特别之处它只与参数绑定有关。将无向图视为有向图意味着消息通道的大小为 2d 而不是 d。
消息函数
矩阵乘法: 从 GG-NN 中使用的消息函数开始该函数由等式定义 边缘网络: 为了允许向量值边特征提出了消息函数 M(hv,hw,evw)A(evw)hwM(hv, h_w, e_{vw}) A(e_{vw})h_wM(hv,hw,evw)A(evw)hw其中 A(evw)A(e_{vw})A(evw) 是一个神经网络它将边向量 evwe_{vw}evw 映射到 d×dd × dd×d 矩阵。
对消息矩阵乘法规则的一个属性是从节点 www到节点 vvv 的消息只是隐藏状态 hwh_whw 和边缘 evwe_{vw}evw 的函数。特别是它不依赖于隐藏状态 hvth^t_vhvt。理论上如果允许节点消息同时依赖于源节点和目标节点则网络可能能够更有效地使用消息通道。这里沿边 eee 从 www 到 vvv 的消息是 mwvf(hwt,hvt,evw)m_{wv} f(h^t_w, h^t_v, e_{vw})mwvf(hwt,hvt,evw)其中 fff是一个神经网络。将上述消息函数应用于有向图时使用了两个单独的函数MinM_{in}Min和 MoutM_{out}Mout。哪个函数应用于特定边 evwe_{vw}evw取决于该边的方向。
虚拟图元素
探索了两种不同的方法来更改消息在整个模型中的传递方式。最简单的修改涉及为未连接的节点对添加单独的“虚拟”边缘类型。这可以作为数据预处理步骤实现并允许信息在传播阶段长距离传播。
Readout功能
尝试了两个Readout功能。首先是GG-NN中使用的Readout函数由公式4定义。该模型首先将线性投影应用于每个元组(hvTxv)(h_v^Tx_v)(hvTxv)然后将投影元组的集合T{(hvTxv)}T \{(h_v^Tx_v)\}T{(hvTxv)}作为输入。然后经过 M 个计算步骤后set2set 模型生成一个图级嵌入 q∗q^∗q∗该嵌入与元组 T 的顺序不变。
Multiple Towers
为了解决O(n2d2)O(n^2d^2)O(n2d2)时间复杂度我们将 ddd 维节点嵌入 hvth^t_vhvt 分解为 kkk 个不同的 d/kd/kd/k 维嵌入 hvt,kh^{t,k}_vhvt,k并分别对 kkk 个副本中的每个副本运行传播步骤以获得临时嵌入 h~vt1,k,v∈G{ \tilde{h}^{t1,k}_v , v \in G}h~vt1,k,v∈G为每个副本使用单独的消息和更新函数。根据方程将每个节点的 kkk 个临时嵌入混合在一起
输入表征
有关所有特征列表请参见表 1。 其中 **化学图**在没有距离信息的情况下邻接矩阵条目是离散键类型单键、双键、三键或芳烃键类型。 距离箱矩阵乘法消息函数假定离散的边类型因此为了包含距离信息将绑定距离分成 10 个箱。 原始距离特征 当使用在向量值边上操作的消息函数时邻接矩阵的条目是5维的其中第一维表示原子对之间的欧氏距离其余四个是键类型的一个热编码。
QM9 Dataset
数据集中的分子由氢 (H)、碳( C)、氧(O)、氮(N)和氟(F)原子组成最多包含 9 个重(非氢)原子。大约134k个药物样的有机分子它们跨越了广泛的化学领域。
结果 在表2中MPNN 在 13 目标中的 11 个目标上实现了化学精度在所有 13 个目标上都达到了最先进的水平。 表 3 中这三种GG-NN模型修改有助于所有 13 个目标并且 Set2Set 输出在 13 个目标中的 5 个目标上实现了化学精度。