基于人工智能(AI)的蛋白质结构预测工具集
发布日期:2022-12-07 作者:康为 点击:
王建民
蛋白质折叠包括在空间中重新排列线性氨基酸序列,使它们处于低能状态。仅根据氨基酸序列预测正确的三维结构是非常困难的,因为肽键的自由组合会产生大量的可能性:即使一个小的蛋白质被顺序采样,也需要比宇宙年龄更长的时间,所以预测是经过计算的,以避免顺序采样的问题。在过去的40年中,计算和预测不断改进,通过X射线晶体学、核磁共振波谱和冷冻电镜实验确定了蛋白质结构序列的同源性。自1994年以来,通过将计算和预测方法应用于新分析的蛋白质结构,每两年对其性能进行一次评估。三年前,AlphaFold的首次实现是应用人工智能分析蛋白质结构的革命性进展。2020年,重新设计的AlphaFold几乎完美准确地预测了蛋白质的三维结构,其预测水平与实验室几乎持平,解决了困扰学术界50年的“蛋白质折叠”难题。DeepMind团队提出了一种名为AlphaFold 2的计算方法,即使不知道相似的结构,也能以原子精度有规律地预测蛋白质结构。2021年7月15日,DeepMind团队在《自然》杂志上发表了一篇文章& # 34;使用AlphaFold进行高度精确的蛋白质结构预测& # 34;,描述了AlphaFold2是基于神经网络新设计的AlphaFold版本,其预测的蛋白质结构可以达到原子级精度。2021年7月15日,华盛顿大学蛋白质设计研究所David Baker教授的研究小组和其他合作机构在Science上发表了一篇论文& # 34;使用三轨道神经网络精确预测蛋白质结构和相互作用& # 34;,并发表了其开源蛋白质预测工具RoseTTAFold的研究成果。
AlphaFold2和RoseTTAFold等数据以及人工智能驱动的蛋白质折叠预测工具,为大分子结构预测和设计提供了强大的驱动力。本文旨在总结相关工具。
https://github.com/sacdallago/folding_tools