当前位置: 首页 > news >正文

单位网站建设管理情况佛山营销型网站

单位网站建设管理情况,佛山营销型网站,电商网站功能结构图,电商关键词seo排名Jumper 本文将介绍 24 年 5 月发布的 Alaphafold3#xff0c;其以“使用 AlphaFold 3 进行生物分子相互作用的精确结构预测”为标题发表在《nature》上#xff0c;通讯作者为 Jumper。 Jumper 具有物理、化学、生物和计算方面的丰富背景。Jumper 本科学的是物理和数学#… Jumper 本文将介绍 24 年 5 月发布的 Alaphafold3其以“使用 AlphaFold 3 进行生物分子相互作用的精确结构预测”为标题发表在《nature》上通讯作者为 Jumper。 Jumper 具有物理、化学、生物和计算方面的丰富背景。Jumper 本科学的是物理和数学本科毕业后开始攻读理论凝聚态物理学博士学位但很快就退学了。2008 年他加入了一家做蛋白质模拟的公司他开始在超级计算机上模拟蛋白质运动。2011 年他再次尝试读研究生他这次选择攻读芝加哥大学的理论化学学位。2017 年刚刚完成博士学位的 Jumper 加入谷歌 DeepMind担任研究科学家领导了AlphaFold 1、2、3的开发。 本文内容主要分为三个部分 AlphaFold3 模型结构 AlphaFold3 在不同类型的预测实验中的表现 在线使用 AlphaFold3 1. AlphaFold3 模型结构 和 AlphaFold2 类似AlphaFold3 的框架由四部分组成输入模块、特征提取模块、编码器、解码器。 AlphaFold3 模型结构 AlphaFold3 模型结构对应的伪代码 下面分别介绍这四部分 1.1 输入模块 输入模块结构 向模型输入序列、配体和共价键然后执行以下三个操作 从 PDB mmCIF 文件中检索模板结构 从 5 个数据库中检索蛋白质序列从 3 个数据库中检索 RNA 序列用于多序列比对MSA如下图所示 Genetics databases 生成参考构象。 输入模块总结输入模块就是将我们输入到模型的内容拿到数据库中去检索相似的模板结构和相似的序列并生成参考构象做好数据准备工作。检索的相似序列、生成的构象、输入序列、配体和共价键将会输入到特征提取模块。 1.2 特征提取模块 特征提取模块结构 特征提取模块伪代码 上图省略了将输入到特征提取模块的内容 token 化这一步骤将输入内容转变为 token 之后再将这些 token 输入到 embedder 中进行 embedding然后输出 Input embeddings, Pair embeddings, single embeddings。 token就是将生物语言用数字表示举个例子就是用 1-20 表示氨基酸。 Alphafold3 的 token 方法 标准氨基酸残基整体作为一个 token 标准核苷酸残基整体作为一个 token 修改过的氨基酸或核苷酸残基每个原子作为一个 token 小分子配体每个原子作为一个 token embedding嵌入列举一个对象的若干个属性并对属性进行赋值产生一个描述这个对象的向量。例如对于姚明这个对象高属性赋值为 0.9矮属性赋值为 -0.9篮球属性赋值为 0.88男人属性赋值为 1有钱属性赋值为 0.3......。再例如对于半胱氨酸这个氨基酸氢键供体属性赋值为 0.5氢键受体属性赋值为 0.6具有可旋转化学键属性赋值为 0.3表面电荷属性赋值为 -0.88......可以选择许多属性了来描述对象。具体到 Alphafold3embedding 就是给输入模型的每一个生物序列单元的每一个属性赋值每一个生物序列单元最终都由一个向量来表示我们思考一下生物序列一般都有哪些属性比如有亲水性、电负性、键角、氢键、可旋转共价键等Alphafold3 为每个token 选择了 384 个属性所以每个 token 会被 embedding 为一个 384 维的向量。对两两 token 之间的关系进行 embedding 时的属性表是另外选择的有 128 个属性。 Input embeddings由伪代码可以看出它是输入的每个 token 的 embeddingembedding 维度为 384从模型数据流可以看出Input embeddings 不参与后面的循环更新但是它参与后面每一个模块的计算。 single embeddings由伪代码可以看出它是由 Input embeddings 乘上一个权重矩阵而得出embedding 维度为 384。 Pair embeddings由伪代码可以看出它表示两两 token 之间的关系embedding 维度为 128计算方法为两个 token 分别乘以一个权重矩阵结果相加再加上一个输入 token 的相对位置编码再加上这两个 token 之间的化学键的信息Pair embeddings 包含了两两 token 之间的位置关系。 通俗总结特征提取模块将输入到特征提取模块的内容表示为计算机能看懂的数字然后再细致地列出他们都有哪些特点以及他们彼此之间的关系怎么样然后将这些得到的信息作为编码器的输入内容。 1.3 编码器 编码器结构 由三个module组成 Template module: 整合在结构数据库中检索到的模板信息关注对结构更重要的区域然后再整合特征提取模块输出的 Pair embeddings得到 Pair representation MSA module: 在上一步的 Pair representation 的基础上添加多序列比对信息更新 Pair representation Pairformer module: 是一个 Transformer module用于更新 Pair representation 和 Single representationSingle representation 由 single embeddings 转化而来过程略。 通俗总结编码器将模板结构信息、特征提取模块输出的 Pair embeddings、多序列比对信息整合在一起生成 Pair representation然后把【对应输入生物序列原始信息的 Single representation】和【Pair representation】输入到善解数意的 Pairformer module 中善解数意的 Pairformer module 能力超群可以把 Single representation 信息和 Pair representation 信息规整的整整齐齐并聚焦到重要信息经过多次循环更新之后输出 Single representation 和 Pair representation。 编码器输出的 Single representation 和 Pair representation 将会输入到 解码器模块。 1.4 解码器 解码器结构 扩散模型扩散模型Diffusion Model是一类生成模型的统称这类模型的核心是通过逐步加噪和去噪过程生成结果。简单理解加噪就是给一个模糊的图像添加马赛克让模糊的图像变得更加模糊去噪就是清除马赛克恢复图像的原有清晰度模型会学习这个清除马赛克的过程延伸一下就是模型会学习如何将一个模糊的图像变成一个清晰的图像。 通过一个直观例子了解扩散模型的作用 从杂乱无章的原子点中恢复出清晰的人像 解码器由两个 Module 组成 Diffusion Module使用扩散模型预测复合物结构具体做法就是Single representation 信息和 Pair representation 信息会转变为空间位置这些信息刚开始看上去还是杂乱无章的原子点看不出结构信息但是经过扩散模型的多次加噪和去噪更新之后杂乱无章的原子点变成了清新的三维结构。 Confidence Module生成预测结构的预测置信度使用预测局部距离差异检验(pLDDT)、预测比对误差(PAE)和预测距离误差(PDE)来评估置信度pLDDT的范围为 0 到 100值越大置信度越高代表预测越准确。 通俗理解解码器解码器将编码器输出的 Single representation 和 Pair representation 经过扩散模型的反复折腾之后生成一个清晰的三维结构并给出这个结构的预测置信度。 2. AF3 在不同类型预测实验中的表现 AlphaFold3 能预测蛋白-小分子互作结构、蛋白-核酸互作结构、共价键修饰和蛋白质结构在这四个类型的测试中它的性能都显著高于竞争对手 RoseTTAFold也高于针对特定类型的对手。 AF3 在不同类型预测实验中的表现 上图从左到右 预测蛋白-小分子配体互作结构的表现盲对接不提供蛋白质结构或指定对接口袋数据集选择的是 PDB 的 PoseBusters benchmark set包含 428 个蛋白-配体结构对比对象选择的是 AutoDock Vina 和 RoseTTAFold All-Atom。AlphaFold3 的表现显著高于 AutoDock Vina 和 RoseTTAFold All-Atom。 预测蛋白-核酸互作结构的表现对比对象选择的是 RoseTTAFold在蛋白-RNA 和蛋白-双链DNA 互作结构的预测上AlphaFold3 的表现都显著高于 RoseTTAFold在蛋白-RNA 互作结构的预测上逊色于基于人类专家知识辅助的 Alchemy_RNA2。 预测共价修饰的表现AF3 能比较准确地预测结合配体、糖基化、修饰的蛋白质残基和核酸碱基等共价修饰。 预测蛋白质复合物结构的表现对比的是自家的前一代预测多亚基蛋白复合物结构的 Alphafold Mutimer 2.3由于 Alphafold Mutimer 本身已经足够优秀留下的提升空间不多所以在预测蛋白蛋白复合物和蛋白单体之间的结构上的能力提升不大预测蛋白-抗体复合物结构的能力大幅提高。 预测蛋白-小分子配体互作结构的表现提供蛋白质结构或指定对接口袋 上图是提供蛋白质结构或指定对接口袋情况下不同方法预测蛋白-小分子配体互作结构的表现对比。可以看到在提供蛋白质结构时AF 3定制版本 AF3 2019 的预测表现显著强于其他方法在指定对接口袋时AF 3定制版本 AF3 2019 pocket specified 的表现显著强于 AutoDock Vina、DeepDock 等一众专业的分子对接软件。 3. 在线使用 AlphaFold3 AlphaFold 3 可以在 https://www.alphafoldserver.com 使用但是目前对允许使用的小分子配体和共价修饰有限制很多还不能使用。如果不限制小分子配体的使用范围AlphaFold 3 将成为一个非常好用的自动化的分子对接软件。 参考内容 https://www.nature.com/articles/s41586-024-07487-w https://www.ebi.ac.uk/training/online/courses/alphafold/inputs-and-outputs/evaluating-alphafolds-predicted-structures-using-confidence-scores/plddt-understanding-local-confidence/ https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-024-07487-w/MediaObjects/41586_2024_7487_MOESM1_ESM.pdf https://mp.weixin.qq.com/s/vAvwsf_mjRJH4IDU3lvpcg?sessionid1726477416subscene0ascene0fasttmpl_type0fasttmpl_fullversion7382233-en_US-zipfasttmpl_flag0realreporttime1726479143208clicktime1726239340enterid1726239340 https://www.bilibili.com/video/BV142K6eBEWN/?spm_id_from333.999.0.0vd_source2e0bed8f939119c48817ce61f4f75bdd 本文由 mdnice 多平台发布
http://www.hkea.cn/news/14339884/

相关文章:

  • 儿童网站模板免费下载网站建设方案前言
  • 如何建造免费的网站企业网站开发技术
  • 学校内部网站开发价格惠州网站建设佳木斯
  • 个人工作室的网站校友网站建设的重要性
  • 网站怎么做适配通州网站建设
  • 网站注册流程和费用什么软件可以推广
  • 免费做店招哪个网站好优惠网站如何做
  • 购物商城外贸网站建设建设网站坪山
  • 帝国网站增加流量有什么网站可以做初中试题
  • wap网站域名申请青海省住房城乡建设厅网站
  • 建设网站政策风险江门市住房建设管理局网站
  • 网站建设对公司有什么好处交互设计网站推荐
  • 地信的网站建设广州网站建设q.479185700強
  • 网站描述和关键词怎么写wordpress语言的设置中文版
  • 做电子商务网站建设工资多少钱电子商务网站开发岗位
  • 乐清网站建设乐清长沙seo外包平台
  • 如何免费申请网站做国外衣服的网站有哪些
  • 腾讯网站安全检测做垂直网站
  • 适合设计制作公司的网站asp远吗python在线编程视频
  • 网站建设最新签约漯河英文网站建设
  • 能打开的a站深圳燃气
  • 能够做代理的网站自己用wordpress建站
  • 怎么获取网站的图片自助手机网站建站软件
  • 写作网站好吗山东中恒建设集团网站
  • 泰安服装网站建设网站平台建设实训内容
  • 网站开发工具介绍团购网站为什么做不走
  • 数字营销1+x网站网站怎样建设友情链接
  • 深圳杰恩创意设计有限公司网站市场营销策划是干嘛的
  • 做期货应关注什么网站化工网站关键词优化
  • wordpress会员制菏泽地网站seo