《科學(xué)》:媲美AlphaFold2的蛋白質(zhì)結構預測新工具問(wèn)世,一臺游戲計算機十分鐘出結果,完全免費
以下文章來(lái)源于學(xué)術(shù)頭條 ,作者學(xué)術(shù)頭條
如今,人工智能已經(jīng)滲透到人們生活的方方面面,各種深度學(xué)習算法也越來(lái)越多地應用于各個(gè)領(lǐng)域。尤其在生物和醫學(xué)領(lǐng)域,人工智能技術(shù)可以說(shuō)大放異彩,極大加速了有關(guān)生物、病理等科學(xué)的發(fā)展,而其中一項重要的應用,就是預測蛋白質(zhì)結構。
蛋白質(zhì)作為構成人體組織器官的支架和主要物質(zhì),在人體生命活動(dòng)中起著(zhù)重要作用。2020 年,DeepMind 在第 14 屆 “蛋白質(zhì)結構預測關(guān)鍵評估”(CASP14)大賽中展示了轟動(dòng)一時(shí)的相關(guān)成果 ——AlphaFold2,當時(shí),該技術(shù)預測蛋白質(zhì)結構的準確度排名第一。
現在,西雅圖華盛頓大學(xué)醫學(xué)院蛋白質(zhì)設計研究所的研究人員,研發(fā)出一款新的深度學(xué)習工具 RoseTTAFold,不僅擁有媲美 AlphaFold2 的蛋白質(zhì)結構預測超高準確度,而且更快、所需計算機處理能力更低,更重要的是,RoseTTAFold 完全免費!
相關(guān)論文發(fā)表在最新一期的 Science 雜志上。
AlphaFold2:聲名大噪的 “前浪”
蛋白質(zhì)是一切生命的物質(zhì)基礎,由無(wú)數氨基酸鏈組成,它們按照特定方式折疊結合成復雜的微觀(guān)形狀,這些獨特的結構反過(guò)來(lái)又引發(fā)了生物體內幾乎所有的化學(xué)過(guò)程。因此,通過(guò)更好地了解蛋白質(zhì)內部結構,科學(xué)家們可以加快開(kāi)發(fā)針對癌癥、COVID-19 和數千種其它健康疾病的新療法。
圖 | 蛋白質(zhì) 3D 結構(來(lái)源:Nat Commun)
Science 雜志曾指出,蛋白質(zhì)折疊問(wèn)題是人類(lèi)在 21 世紀需要解決的 125 個(gè)科學(xué)前沿問(wèn)題之一。通過(guò)蛋白質(zhì)結構預測破譯 “第二遺傳密碼”,是生物學(xué)中心法則尚未揭示的奧妙之一,也是目前結構生物學(xué)面臨的一項具有挑戰性的重大基礎性研究課題。
然而,確定蛋白質(zhì)的 3D 結構一直是一個(gè)難題。在過(guò)去的幾十年中,人類(lèi)已經(jīng)能夠利用冷凍電子顯微鏡、核磁共振或 X 射線(xiàn)晶體學(xué)等實(shí)驗技術(shù)確定蛋白質(zhì)的基本結構,但這些技術(shù)基于大量試錯,往往需要花費數年時(shí)間,成本也非常高。
近年來(lái),隨著(zhù)人工智能技術(shù)的不斷發(fā)展,有關(guān)預測蛋白質(zhì)結構的 AI 工具也越來(lái)越成熟。其中,性能最強、準確度最高的就是去年 DeepMind 在 CASP14 蛋白質(zhì)結構預測評估會(huì )議上展示的 AlphaFold2。在去年的比賽中,AlphaFold2 預測的大部分結構達到了空前的準確度,不僅與實(shí)驗方法得出的結果不相上下,還遠超解析新蛋白質(zhì)結構的其他方法。
圖 | AlphaFold2 預測的蛋白結構與實(shí)驗結果幾乎一致。(來(lái)源:DeepMind)
AlphaFold2 的高性能令世人矚目,然而人們也開(kāi)始思考一個(gè)問(wèn)題:除了 DeepMind 這種在世界領(lǐng)先的深度學(xué)習公司以外,其他機構或科研團隊開(kāi)發(fā)的系統中是否也可以實(shí)現這種準確性呢?
RoseTTAFold:公開(kāi)免費的 “后浪”
現在,肯定的答案浮出水面。
在此次的新研究中,華盛頓大學(xué)醫學(xué)院生物化學(xué)系教授、蛋白質(zhì)設計研究所所長(cháng) David Baker 領(lǐng)導一支計算生物學(xué)家團隊,成功開(kāi)發(fā)一款名為 RoseTTAFold 的工具,基于深度學(xué)習,能夠根據有限的信息快速準確地預測出目標蛋白質(zhì)的結構,達到與 AlphaFold2 不相上下的準確度。
圖 | David Baker(來(lái)源:UW)
不僅如此,RoseTTAFold 所需的計算耗能與計算時(shí)間均比 AlphaFold2 還要低:僅用一臺游戲計算機,在短短十分鐘內就可以可靠地計算出蛋白質(zhì)結構。更值得注意的是,RoseTTAFold 的代碼和服務(wù)器完全免費提供給科學(xué)界!自 7 月以來(lái),相關(guān)程序已被 140 多個(gè)獨立科研團隊從 GitHub 免費下載,來(lái)自世界各地的科學(xué)家現在正在使用 RoseTTAFold 來(lái)構建蛋白質(zhì)模型,以加速相關(guān)領(lǐng)域的研究。
因此可以說(shuō),RoseTTAFold 不僅僅是 “免費版” 的 AlphaFold2,更是該技術(shù)領(lǐng)域推翻 “前浪” 的那一股 “后浪”。
整個(gè)研究學(xué)界都將受益
實(shí)際上,RoseTTAFold 是一個(gè) “三軌” 神經(jīng)網(wǎng)絡(luò )("three-track" neural network),這意味著(zhù)它同時(shí)考慮一維蛋白質(zhì)中的氨基酸序列、二維蛋白質(zhì)的氨基酸如何相互作用以及蛋白質(zhì)可能的三維結構。在這種架構中,一維、二維和三維信息來(lái)回流動(dòng),從而使神經(jīng)網(wǎng)絡(luò )能夠共同推理出蛋白質(zhì)的化學(xué)部分與其折疊結構之間的關(guān)系。
目前,該團隊已經(jīng)使用 RoseTTAFold 計算了數百種新的蛋白質(zhì)結構,其中包括許多來(lái)自人類(lèi)基因組的知之甚少的蛋白質(zhì)。研究人員還生成了與人類(lèi)健康直接相關(guān)的蛋白質(zhì)結構,包括與非正常脂質(zhì)代謝、炎癥障礙和癌細胞生長(cháng)相關(guān)的蛋白質(zhì)結構。這些成果都表明,RoseTTAFold 可以?xún)H用從前所需時(shí)間的很小一部分,構建出復雜生物組件的模型。
圖 | 研究人員使用 RoseTTAFold 生成了數百種新的蛋白質(zhì)結構,包括人類(lèi)白細胞介素 12 與其受體結合的 3D 視圖(來(lái)源:UW Medicine Institute for Protein Design)
當然,看似 “小小” 的一步,背后支撐的是整個(gè)研究團隊的努力。作為團隊主要負責人,Baker 說(shuō):“在蛋白質(zhì)設計研究所這忙碌的一年中,我們設計 COVID-19 療法和疫苗并將其投入臨床試驗,同時(shí)開(kāi)發(fā)出用于高精度蛋白質(zhì)結構預測的 RoseTTAFold 工具。我很高興科學(xué)界已經(jīng)在使用 RoseTTAFold 服務(wù)器來(lái)解決突出的生物學(xué)問(wèn)題?!?/p>
可以想見(jiàn)的是,如此一款便捷免費、高準確度、低成本的工具必然會(huì )受到世界各地的科研人員的歡迎。團隊成員之一、博士后學(xué)者 Minkyung Baek 也表示:“我們希望 RoseTTAFold 新工具在今后,繼續使整個(gè)研究學(xué)界受益?!?/p>
參考資料:
https://science.sciencemag.org/content/early/2021/07/14/science.abj8754
https://science.sciencemag.org/content/373/6552/262
https://newsroom.uw.edu/news/accurate-protein-structure-prediction-now-accessible-all
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。