蛋白質(protein)是構成生命體的重要物質,其功能在很大程度上取決于它獨特的三維結構。在過去的50年里,“蛋白質折疊問題”一直是生物學界最大的謎團。盡管X 射線晶體學和冷凍電子顯微鏡等實驗技術的加入已經幫助確定了約10萬種蛋白質結構,但與人體內數十億已知蛋白質序列的相比,可謂是杯水車薪。?轉折出現在2018年,曾開發了著名人工智能圍棋程序AlphaGo的人工智能企業DeepMind帶來了一種名為AlphaFold的人工智能系統,首次在國際蛋白質結構預測競賽(CASP)上亮相。而就在2020年的CASP 中,該公司帶來了進階版的AlphaFold2程序擊敗了大約100個團隊,對三分之二的蛋白靶點給出幾乎與實驗室解析相等的結構預測結果。驚嘆于人工智能的卓越,CASP的聯合創始人John Moult甚至直言,“從某種意義上說,問題已經解決。”
今天,在解決蛋白質折疊這一“生物學近50年來的重大難題”方面,頂級期刊《Nature》及《Science》上的研究報告分別為生物學界照進了一束光。
DeepMind公司在《Nature》雜志上發表的題為Highly accurate protein structure prediction with AlphaFold的論文中,公開了進階版的AlphaFold2人工智能系統的源代碼,并且詳細描述了它的設計框架和訓練方法。與初版的AlphaFold相比,AlphaFold2解析蛋白結構的速度有了顯著的提升。?
//doi.org/10.1038/s41586-021-03819-2?DeepMind公司AlphaFold首席研究員John Jumper說:“與去年亮相的AlphaFold2相比,新的程序處理蛋白質結構的速度提升了大約16倍。”?根據蛋白的大小,新版本的AlphaFold2可以在幾分鐘到幾小時內生成準確的蛋白質結構。另外,這一模型還可以根據每個氨基酸對其預測可靠性進行精確預估,有助于研究人員使用其預測結果。?在DeepMind公司公布AlphaFold2框架的同一天,華盛頓大學David Baker研究團隊也在Science發表了題為Accurate prediction of protein structures and interactions using athree-track neural network的文章,公布了受AlphaFold2啟發研制出來的RoseTTaFold,該程序在解構蛋白質結構方面的表現可與AlphaFold2比肩。?
DOI:10.1126/science.abj8754?去年,當AlphaFold2在CASP上脫穎而出時,許多結構生物學家感到既興奮又沮喪,David Baker也是其中之一,他說:“如果有人解決了你正在解決的問題,但沒有透露他們是如何做到的,你該如何繼續你的工作呢?”?顯然,David Baker并沒有氣餒,而是與同事一起找到了獨立于AlphaFold2的新“出路”。他們確定了幾項關鍵進展,包括如何使用與研究人員預測的目標相關的蛋白質信息,某一部分的預測結構如何影響神經網絡處理其他相應的序列,并最終帶來了RoseTTAFold。?
RoseTTAFold的網絡架構和性能?與 AlphaFold2一樣,RoseTTAFold能夠借助人工智能在大量示例數據庫中識別模式的能力,在學習時生成更精準和可靠的模型。在給一個新的蛋白質建模時,RoseTTAFold 會沿著多個“軌道”進行,同時考慮蛋白質的氨基酸序列、氨基酸之間的相互作用以及編譯蛋白質可能出現的3D結構,通過在軌道間來回“跳躍”從而讓程序綜合所有信息。
當然,與AlphaFold2相比,RoseTTAFold在準確度上稍微遜色一些。不過,AlphaFold2僅能解決單個蛋白質的結構問題,而RoseTTAFold可用于預測不同蛋白相互結合的結構模型,比如使用IL-12和IL-12受體(IL-12R)的序列預測復合體結構,實驗證明最終結果與此前用冷凍電子顯微鏡解析的結構非常相似。?
使用 RoseTTAFold 進行復雜結構預測?在《Nature》同日發布的一篇報道中,伊利諾伊州芝加哥大學的計算生物學家?Jinbo Xu?說,這些工具的開源性質意味著科學界應該能夠在進步的基礎上開發出更強大、更有用的軟件,這將推動生物學研究向前邁進一大步。?目前,DeepMind公司承諾會繼續分享人工智能預測蛋白質3D結構的方法,并為科學共同體提供廣泛、免費的獲取途徑。而Baker所在的小組也已經公布了其計算機代碼,并建立了一個服務器,允許其他研究人員使用。據悉,自從上個月推出以來,該服務器已經預測了大約500人提交的5000多種蛋白質的結構,而計算機代碼也已被下載 250 次。
End
參考資料:
[1]//www.nature.com/articles/d41586-021-01968-y
[2]//www.sciencemag.org/news/2021/07/researchers-unveil-phenomenal-new-ai-predicting-protein-structures
[3]//www.nature.com/articles/s41586-021-03819-2#Abs1
[4]//science.sciencemag.org/content/early/2021/07/14/science.abj8754