分享一篇發(fā)表在Nature上的文章,文章標題“Accurate structure prediction of biomolecular interactions with AlphaFold?3”,文章的通訊作者是來自Google DeepMind的John M. Jumper,Isomorphic Labs的Max Jaderberg,以及以上兩個公司的創(chuàng)始人Demis Hassabis。其中Isomorphic Labs致力于AI制藥方面的研究。
AlphaFold2(AF2)是精確建模蛋白質(zhì)結(jié)構(gòu)的一座里程碑。在過去的三年中,AF2已經(jīng)被廣泛應(yīng)用于蛋白質(zhì)建模和設(shè)計中。但是,AF2只能預測蛋白的結(jié)構(gòu),實現(xiàn)更廣泛的復合物結(jié)構(gòu)預測仍是一個不小的挑戰(zhàn)。目前發(fā)展的復合物結(jié)構(gòu)預測方法大多數(shù)局限于特定的復合物類型(如蛋白質(zhì)-核酸復合物),無法泛化至其它復合物類型。最近Krishna等人發(fā)展的RoseTTAFold All-Atom模型(10.1126/science.adl2528)為解決此問題帶來希望,但是其模型的預測精度有待進一步提高。在本文中,作者發(fā)展了AlphaFold3(AF3)模型,能夠以較高的精度預測幾乎所有類型的生物復合物。作者進一步更新AF2的模型架構(gòu)以適應(yīng)更一般的復合物建模。主要改進如下:在輸入層面,針對小分子輸入,使用RDKit生成可能的構(gòu)象;使用Pairformer模塊替換原有的Evoformer模塊,簡化所需MSA的數(shù)量;在輸出層面,使用擴散模型直接預測原子坐標。在模型評估中,AF3在包括蛋白質(zhì)-小分子配體、蛋白質(zhì)-核酸、蛋白質(zhì)的共價修飾、蛋白質(zhì)-蛋白質(zhì)等幾乎所有類型的任務(wù)上均超越了現(xiàn)有方法。然而,AF3仍存在一些局限性。其一,錯誤的立體化學預測。AF3可能錯誤預測分子手性(盡管在輸入過程中提供了手性信息),預測得到的原子也可能發(fā)生重疊;其二,模型幻想問題。AF3預測可能將無序區(qū)域預測成虛假的有序結(jié)構(gòu);其三,無法預測蛋白質(zhì)的動態(tài)結(jié)構(gòu)。即使改變擴散模型中的隨機種子,模型也無法很好估計溶液狀態(tài)下蛋白質(zhì)的結(jié)構(gòu)系綜,對于某些多構(gòu)象的蛋白質(zhì),AF3只能預測其中一種構(gòu)象。最后需要指出的是,AF3并不提供源代碼(只提供用于描述算法的偽代碼),目前使用AF3的唯一途徑是通過AF3服務(wù)器(https://www.alphafoldserver.com/)進行預測。在蛋白-小分子配體復合物的結(jié)構(gòu)預測上,用戶只能輸入服務(wù)器提供的有限數(shù)量的小分子,共包括:ATP、ADP、AMP、GTP、GDP、FAD、NAD、NADP、NADPH、Heme、Heme C、棕櫚酸、油酸、豆蔻酸、檸檬酸、葉綠素A、葉綠素B、細菌葉綠素A、細菌葉綠素B。文章鏈接:https://www.nature.com/articles/s41586-024-07487-w原文引用:DOI:10.1038/s41586-024-07487-w